removeStopWords
문서에서 불용어 제거
구문
설명
"a", "and", "to", "the" 같은 단어(불용어라고 함)는 데이터에 잡음을 추가할 수 있습니다. 분석 전에 이 함수를 사용하여 불용어를 제거하십시오.
이 함수는 한국어, 영어, 일본어, 독일어 텍스트를 지원합니다. 다른 언어에서removeStopWords
함수를 사용하는 방법을 알아보려면언어 고려 사항항목을참조하십시오。
는newDocuments
= removeStopWords(documents
)tokenizedDocument
배열documents
에서 불용어를 제거합니다. 기본적으로 이 함수는documents
의 언어 세부 정보에 따라stopWords
함수에서 제공된 불용어 목록을 사용하며 대/소문자를 구분하지 않습니다.
사용자 지정 단어 목록을 제거하려면removeWords
함수를 사용합니다.
는newDocuments
= removeStopWords(documents
,'IgnoreCase',false)stopWords
함수에 의해 지정된 불용어 목록과 대/소문자가 일치하는 불용어를 제거합니다.
팁
removeStopWords
함수는normalizeWords
함수에 의해 제거되는 정보를 사용하므로 이 함수를 사용하기 전에removeStopWords
함수를사용해야합니다。