自然語言處理:是人工智能領(lǐng)域的重要研究方向,即實現(xiàn)人機之間用自然語言進(jìn)行有效的通信,包括自然語言理解和自然語言生成兩個部分。本方向研究的主要內(nèi)容包括:
1.漢語字符識別:利用計算機圖像處理技術(shù)準(zhǔn)確提取漢語字符,為后續(xù)工作奠定基礎(chǔ),并著重研究字符存在旋轉(zhuǎn),字體、縮放、位置等差異時的提取算法,提高字符識別的準(zhǔn)確性和穩(wěn)定性。
2.建立知識表示庫,進(jìn)行漢語文本的信息提取和知識挖掘。利用數(shù)據(jù)挖掘等技術(shù)提取漢語文本的有效信息,對自然語言文本自動地提取索引詞,過濾,檢索,自動提取重要信息,進(jìn)行自動摘要。
3.建立大規(guī)模、信息豐富的詞典庫。深入研究知識的收集,存儲,技術(shù),并利用它們有效消除漢語中的歧義,以提高語言理解的正確程度。
人臉特征檢測:即在圖像或圖像序列的給定區(qū)域內(nèi)搜索部分或所有人臉特征(如眼、鼻、嘴、耳等)的位置、關(guān)鍵點或輪廓線。目前關(guān)于這方面的方法包括基于先驗規(guī)則、色彩信息、外觀信息等算法,主要集中于理想的正面圖像,而圖像出現(xiàn)大幅度轉(zhuǎn)動、側(cè)像、表情變化、遮擋、眼鏡、圖像質(zhì)量差、分辨率低等現(xiàn)象始終是人臉特征檢測的難題之一。