+ Có kiến thức cơ bản về Xác suất thống kê, Học máy thống kê, Xử lý ngôn ngữ tự nhiên
+ Hiểu rõ về mô hình ngôn ngữ (language model), các bài toán core của NLP, các thư viện thường được sử dụng trong NLP tiếng Việt, Anh, Nhật.
+ Có kiến thức về các mô hình cơ bản trong machine learning như Linear regression, Logistic regression, SVM, CRF,...
+ Ưu tiên các ứng viên có kiến thức về Deep Neural Network, LSTM, CNN ứng dụng trong NLP
+ Ưu tiên các ứng viên có kinh nghiệm ứng dụng các thuật toán trên trong các bài toán cơ bản của NLP như tách từ, gán nhãn từ loại, nhận diện danh từ riêng/thực thể, trích xuất quan hệ, tìm kiếm thông tin, lý giải ngôn ngữ tự nhiên
+ Có kiến thức về Information Retrieval, Information Extraction
+ Ưu tiên các ứng viên có kiến thức về Web crawling, scraping, Nutch, Solr, Hadoop, Spark và các hệ thống xử lý dữ liệu lớn khác
+ Ưu tiên các ứng viên có khả năng đọc các bài báo khoa học trong ngành NLP (ví dụ các bài báo từ Hội thảo ACL, EMNLP, NAACL, COLING, ...)
+ Có kiến thức cơ bản về Khoa học máy tính và Lập trình hướng đối tượng
+ Có khả năng lập trình thành thạo với ít nhất một trong các ngôn ngữ sau : Python, Java, C++/C
+ Tốt nghiệp Đại học hệ chính quy hoặc có trình độ tương đương