1、 Support Vector Machine日本語係受解析奈良先端科学技術大学院大学情報科学研究科 自然言語処理学講座工藤 拓 松本裕治係受解析n 日本語統語解析基本技術n 二文節間係数値化行列作成,文全体最適化係受関係導出n 人手手法、解析済統計的求手法統計的係受解析n 入力文節列n 係先列n 文節 i, j 言語的特徴示次元素性 n 係関係独立仮定 従来手法問題点 (1)n 慎重素性選択必要n 多素性使用過学習n 最適素性集合選択試行錯誤人手頼従来手法問題点 (2)n 各素性組合(共起,依存関係)効率学習n 共起選択方法, 人手発見的 選択n 細依存関係見 ,計算量増加,過学習例Supp
2、ort Vector Machine(1)n V.Vapnik 95n 入力素性数依存汎化能力持過学習n 計算量変,素性組合(共起,依存関係)含学習可能SVM(2)線形値(正例,負例)分類器, Euclid空間上平面分離正例,負例,他 (領域),領域分割SVM(3) d 最大 |w| 最小d最大識別平面SVM(4)以下制約付多項式最適化問題帰着Lagrange乗数 導入双対問題変換最終的識別関数最小化:制約条件:制約条件:最大化:Kernel関数 (1)線形分離場合各素性組合展開,高次元素性空間射影線形分離1 2 3 4 5 6 71 2 4 5 6 7 1,2 1,3 1,4 1,5 1,6 1,7 2,3 2,4 2,5