Reduccióndepalabrasa suRaíz

Stemming ES UNATécnicadeIrmanitizacióndeTextoen Elprocesamiento del lenguaje自然que减少las palabras a suRaíz。LaTécnicade Stemming elpilina los afijos de las palabras,lo que puede generar palabras noválidas。Por Ejeallo,Luego de Aplicar Stemming,Las Palabras“Pensando”,“Pensado”Y“Pensamiento”SEReduciránA“Pensa”。

POR LO General,Stemming Se Equ:

  • BúsquedadeInformación,戴迪拉斯帕拉斯雷卡尼斯A SuRaízSeuterizanComoSinónimosPara Amplitiar Los Critios debúsqueda
  • aplicaciones deingenieríapara reducir la Divelionadad,Donde Stemming Ayuda A Reducir La Cantidad de Palabras Que SERastrearányMuterizaránen Modelos Con Algoritmos De Machine Con Algoritmos De Machine Seature

El Algoritmo de Porter Es Uno deLosMétodosdeStemmingMásFrecuentes帕拉El IdiomaInglésySESEBasa en ReglasHeurísticasSimple。EsteMétodoesRápido,佩罗没有Siempre Preciso。Se Han Propuesto Modos Otros Algoritmos de Stemming,Pero El de Porter Se Sigue Uterizo Con Frecuencia Debido A Su Velocidad Y Sencillez。

OtroMétodoRelacionado Con Stemming,PeroMásSofisticado,Es LaLematización。EN COMPACIONISNINGING,LaLematización:

  • Utanálisis莫尔菲诺,Mientras Que Stemming UthlasHeurísticas的模拟
  • Devuelve Palabras Con El Formato En Aparecen en En El Diccionario,Mientras Que Stemming Puede Devolver Palabras NoVálidas

las diferencias entrelematizaciónystemming se indinan acontinanión。

Palabra lematización.
Pensando. Pensar. Pensa.
Pensado Pensar. Pensa.
Pensamiento. Pensamiento. Pensa.

Para ObenerMásFexficaCiónSobreStemming YCómoCrearModelos Con Datos De Texto,ConsulteText Analytics Toolbox™

TambiénPuende咨询estos temas:procesamiento del lenguaje自然análisisde sentimientoWord2vec.n-grama.Mineríade Textos Con Matlab数据科学深度学习深度学习工具箱™统计和机器学习工具箱™