关于我
小男孩,一个90后小伙子!13年入行一边工作一边积累经验,分享一些个人日记模板,以及NLP等心得。
一直潜心研究NLP前沿技术,一边工作一边积累经验,分享一些个人日记模板,以及NLP优化等心得。我入行早,大家也亲切的叫我小伙子。
NLP奋斗了将近两年时间,在深度学习领域积累到一定的经验,期间有很多的不容易,但是都没有放弃过。入了这一行,就深深的喜欢上它。我喜欢一句话“冥冥中该来则来,无处可逃”。
近几年我也发现个人日记排前几页的也有很多是我做过的模板,感谢各位站长的欣赏,我仔细看过他们的网站。他们在我原模板的基础上有修改,而且他们做的原创内容都是值得一读的。有时候甚至排名都超过了我个人日记网站的排名。
看NLP的书有一段时间了,可貌似什么也没学到,没有静下来看。。现在把仅有的一点东西记录下吧,省得又忘了。
句法分析:句法分析的思想是根据某种语法G给出一个句子S的句法分析树。句法分析也就相当于对一个句子进行语法结构的分析,这对消除句子歧义、自然语言生成很有用。
搭配:搭配是由两个或者两个以上的词所组成的语言表示,也就是人们的习惯用法。例如,我们可以说a stiff breeze,而不能说a stiff wind。而识别搭配有很多作用,例如:自然语言生成、句法分析。识别搭配的方法:使用频率信息、基于含义和主词搭配词之间距离的识别、基于假设测试和互信息的识别。
n元语法模型:即一句话中一个词只与它的前n-1个词有关,这种N-1阶马尔科夫链,又被称为N元语法模型。
语义消歧:很多词有几个意思,利用上下文确定其中的一个意思。不同的消歧算法:有监督的消歧、基于词典的消歧、无监督消歧。
词汇获取:即词汇的句法、语义特征的获取。
马尔可夫模型:
一个形式语言是上下文无关的,如果它是由上下文无关文法生成的。
概率上下文无关文法:即位每一个产生式规则增添一个概率,说明使用规则的可能性