作者:
出版社:
本书是从机器学习和数据挖掘的视角对人类语言学习中的词汇习得展开研究,以无监督和半监督的方式挖掘出语音数据中重复出现的模式作为“词汇”。所涉及的方法包括:非负矩阵分解、隐马尔可夫模型及二者的耦合模型,其有效性已在真实语音数据集实验中得到验证。这些方法也可用于除词汇习得外的其他序列模式识别和挖掘任务。