自然言語処理技術 BERTの利用 その1

仕事で自然言語処理技術のBERTを使うことになった。

自然言語処理をやること自体が初めてで、Githubにある情報を見たけどまるでわからなかったので、あれこれ調べてみた。

github.com

 

自然言語

そもそも自然言語とは、

人間がお互いにコミュニケーションを行うための自然発生的な言語である。

(引用:自然言語 - Wikipedia

 

その自然言語を処理することは、

自然言語処理(しぜんげんごしょり、英語: natural language processing、略称:NLP)は、人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術

(引用:自然言語処理 - Wikipedia

 

自然言語処理技術の基礎技術とは、

形態素解析
構文解析
・語義の曖昧性解消
・照応解析

(引用:自然言語処理 - Wikipedia)

 

形態素解析とは、

形態素解析(けいたいそかいせき、Morphological Analysis)とは、文法的な情報の注記の無い自然言語のテキストデータ(文)から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの形態素の品詞等を判別する作業である。

(引用:形態素解析 - Wikipedia

 

構文解析とは、

構文解析(こうぶんかいせき、syntactic analysis あるいは parse)とは、文章、具体的にはマークアップなどの注記の入っていないベタの文字列を、自然言語であれば形態素に切分け、さらにその間の関連(修飾-被修飾など)といったような、統語論的(構文論的)な関係を図式化するなどして明確にする(解析する)手続きである。自然言語については自然言語処理における要点のひとつであり、プログラミング言語など形式言語の場合は、形式文法に従い構文木を得る。構文解析を行う機構を構文解析器(parser)と呼ぶ。

(引用:構文解析 - Wikipedia

 

これだけではなくて、他にも基礎技術があった。

https://image.slidesharecdn.com/random-120207213330-phpapp02/95/-7-728.jpg?cb=1328650940

(引用:大規模データ時代に求められる自然言語処理) 

 

基礎的な自然言語処理のこと、そこで使われる基礎技術のことが何となくわかった。

次では、自然言語処理技術のBERTについて。