一个语法是一个éléments继承者的集合,在一个文件文本中,我们要理解mots, nombres, symbols和pontion。Les modèles n-gramme peuvent servir在nombreus应用中分析文本,在lesquelles séquences de mots sont appropriées,来分析情感,文本分类和génération文本。例如,在suivante这个短语中:
«Les nuages de mots-clés provenant de tableaux de chaînes de caractères和Les nuages de mots-clés provenant de modèles de mots et des thèmes de LDA peuvent être créés avec文本分析工具箱。»
《Les nuages》»est un 2-gram (bigramme)、《sac de mots》»est un 3-gram (trigramme)、《avec文本分析工具箱》»est un 4-gram, et ainsi de suite。n-gram的尾部dépend应用和表达式的尾部utilisées在这个应用中。
modélisation n-gram是一种命名技术utilisées pour convertir du text d'un format非structuré à un format structuré。除了n-gram之外,还存在一些词嵌入的技术word2vec.有可能在créer un modèle的语言中包含n-gram,并在文件中包含où查n-gram apparaît。Cela s'appelle un modèle de sac de n-grammes。举个例子précédent, le modèle n-g的sac n=2,在这个表中:
n-grammes | 出现 |
nuages de mots-cles | 2. |
表格chaînes de caractères | 1. |
Modèles de sac de mots | 1. |
我们可以通过modèle来构建语言,通过être utilisé来学习机器学习的算法,通过créer来分析文本的应用程序。Pour en savoir plus sur n-grammes and la création de modèles avec des données text, consultez文本分析工具箱™, à utiliser avec MATLAB®.