[자격요건] 다국어 자연어처리 및 응용 기술개발 (개발경험 5년 이상) [세부 자격 요건] - 규칙과 사전 기반의 형태소분석, 태깅, 개체명인식, 복합어처리, 구문분석등 언어처리 기술개발 경험(한국어, 영어, 일본어 중 최소 한 언어)(개발경험 5년 이상) - 기계학습 알고리즘을 이용하여 한/영/일 중 최소 하나의 언어에 대해 품사태깅/개체명인식/청킹 기술 개발 경험(개발 경험 3년 이상) - 대용량의 텍스트 데이터로부터 통계 추출 및 품사/구문 중의성 해소 모델링 경험(HMM, PCFG등)(개발경험 5년 이상) - 언어처리를 위한 대용량 학습데이터 구축 도구개발 경험(개발경험 3년 이상) - 대용량 텍스트 데이터 분석을 통한 키워드/Sentiment/개체명/이벤트추출 경험(개발경험 3년 이상) - 뉴스/문서의 자동분류 및 스팸필터링 기술 개발 경험(개발경험 3년 이상) - 통계기반의 자동번역 기술 개발 경험(개발경험 5년 이상)
[전문 지식] - SVM, MaximumEntropy, CRF, HMM, Graph Learning, kNN, k-Means등 Machine Learning 알고리즘에 대한 이해 - Supervised Learning vs. Unsupervised Learning의 장단점 비교에 따른 상황별 활용 - 확률, 통계에 대한 지식 및 그에 기반한 언어 통계 모델링 - 한국어/영어/일본어 등에 대한 언어처리 전문지식: 형태소분석/결합 지식, 구문구조 문법, 의존문법 등의 설계 및 규칙개발 - 계산통계 언어학(Computational Linguistics)에 대한 전반적 이해 - Compiler, Viterbi Searching, Chart Parsing, Finite State Automata, Finite Transducer 등 언어처리 특화 알고리즘 - Trie/Hash/Btree/Map등의 대용량 사전 엔트리의 저장/검색을 위한 사전구조 - Dynamic Programming을 포함한 Sorting/Searching 알고리즘 - C/C++, Java, Python Programming 및 JNI 연동 등 - Hadoop/HDFS/Hbase/ 등 분산 framework 이해 - 통계/기계학습 기반의 자동번역 알고리즘