中文文本自动分词与标注汉语词义自动标注技术.PPT

中文文本自動分詞與標注 第 8章 漢語詞義自動標註技術 報告人:劉謦儀 (J94922018)Date 1綱要 詞義標注 詞義排歧 詞義自動標注 與 詞義自動排歧 語言的編碼 漢字字義組合結構 基於字義排歧的模型 自組織的漢語詞義排歧方法 結語Date 2詞義標注 對文本中的每個詞根據其所屬之上下文

中文文本自动分词与标注汉语词义自动标注技术.PPTTag内容描述:

1、畫、樂譜等都可以進行語義編碼。
詞典 釋義文本中的某個 義項號 義類詞典中相映的 義類編碼 Date 3詞義排歧 處理一詞多義現象 例: 大學 是教育機構是一本古書, 博士 既是官名,又是博學多才的人,又是師傅,還是一種學位的名稱。
使用詞義標注文本可 提高檢索時的查全率和查準率 。
有利於選擇可以 恰當表達語句中詞的目標詞 ,以提高翻譯的準確性。
建立基於語義類的語言模型 ,為語音識別、手寫體識別和音字轉換提供幫助。
Date 4詞義自動標注 ( Word Sense Tagging ) 也稱為詞義自動排歧 ( Word Sense Disambiguation ) 計算機 運 用邏輯運算與推理機制, 對出現在一定上下文中詞語的語義 進行正確的判斷, 自動確定其正確的義項並加以標注 的過程。
多義詞排歧 主要 依據該多義詞出現的上下文 ,排歧的過程就是 建立他們之間的聯繫過程 ,這種聯繫則是詞語間的語義聯繫。
常見方法 人工智能法、基於詞典的方法、 基於語料庫的方法Date 5語言的編碼 分為 語音編碼 和 語義編碼 兩大類 語音編碼 :。

【中文文本自动分词与标注汉】相关PPT文档
标签 > 中文文本自动分词与标注汉语词义自动标注技术.PPT[编号:848111]

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。