主要内容

分析日语文本数据

这个示例展示了如何使用主题模型导入、准备和分析日语文本数据。

日文文本数据可能很大,并且可能包含许多负面影响统计分析的噪音。例如,文本数据可以包含以下内容:

  • 词形的变化。例如,“難しい”(“困难”)和“難しかった”(“很困难”)

  • 添加噪音的词。例如,停止词如“あそこ”(“那里”)、“あたり”(“约”)和“あちら”(“”)

  • 标点符号和特殊字符

这些词云说明词频率分析应用于原始文本数据从“吾輩は猫である”被夏目漱石,和一个预处理相同版本的文本数据。

这个示例首先展示了如何导入和准备日语文本数据,然后展示了如何使用Latent Dirichlet Allocation (LDA)模型分析文本数据。LDA模型是一个主题模型,它发现文档集合中的底层主题,并推断主题中的单词概率。使用以下步骤准备文本数据和拟合模型:

  • 阅读网页上的HTML代码。

  • 解析HTML代码并提取相关数据。

  • 使用标准的预处理技术准备文本数据进行分析。

  • 适合主题模型并可视化结果。

导入数据

读取数据从“吾輩は猫である”被夏目漱石https://www.aozora.gr.jp/cards/000148/files/789_14547.html使用webread函数。

属性指定文本的字符编码weboptions函数。要找到HTML的正确字符编码,请查看HTML代码的头部。对于这个文件,指定字符编码为"shift_jis“

URL =.“https://www.aozora.gr.jp/cards/000148/files/789_14547.html”;选择= weboptions (“CharacterEncoding”“Shift_JIS”);代码= Webrabread(URL,选项);

查看HTML代码的前几行。

extractBefore(代码,
ANS =“ <!DOCTYPE HTML PUBLIC! “ -  // W3C // DTD XHTML 1.1 // EN”“http://www.w3.org/TR/xhtml11 / DTD / xhtml11.dtd “>    <元HTTP-当量= “内容样式类型” CONTENT = “文本/ CSS”/> <链接的rel = “样式表” 类型= “文本/ CSS的” href = “../../ aozora.css”/> 夏目漱石吾辈は猫である</ TITLE>“</pre>
              </div>
             </div>
            </div>
            <p>从HTML使用中提取文本数据<code class="literal">extractHTMLText</code>.将文本分割为<code class="literal">换绳</code>字符。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>textData = extractHTMLText(代码);textData =字符串(分裂(textData换行));textData (1:10)</pre>
              </div>
             </div>
            </div>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeoutput">
               <pre>ans =<span class="emphasis"><em>10×1的字符串数组</em></span>“吾辈は猫である” “” “夏目漱石” “” “” “” “一” “” “吾辈は猫である。名前はまだ无い。”“どこで生れたかとんと见当がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは记忆している。吾辈はここで始めて人间というものを见た。しかもあとで闻くとそれは书生という人间中で一番狞悪な种族であったそうだ。この书生というのは时々我々を捕えて煮て食うという话である。しかしその当时は何という考もなかったから别段恐しいとも思わなかった。ただ彼の掌に载せられてスーと持ち上げられた时何だかフワフワした感じがあったばかりである。掌の上で少し落ちついて书生の颜を见たのがいわゆる人间というものの见始であろう。この时妙なものだと思った感じが今でも残っている。第一毛をもって装飾されべきはずの顔がつるつるしてまるで薬缶だ。その後猫にもだいぶ逢ったがこんな片輪には一度も出会わした事がない。のみならず顔の真中があまりに突起している。そうしてその穴の中から時々ぷうぷうと煙を吹く。どうも咽せぽくて実に弱った。これが人間の飲む煙草というものである事はようやくこの頃知った。"</pre>
              </div>
             </div>
            </div>
            <p>删除文本的空行。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>idx = textData ==<span style="color:#A020F0">""</span>;textData (idx) = [];textData (1:10)</pre>
              </div>
             </div>
            </div>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeoutput">
               <pre>ans =<span class="emphasis"><em>10×1的字符串数组</em></span>“吾輩は猫である”“夏目漱石”““一”“吾輩は猫である。名前はまだ無い。”“どこで生れたかとんと見当がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。吾輩はここで始めて人間というものを見た。しかもあとで聞くとそれは書生という人間中で一番獰悪な種族であったそうだ。この書生というのは時々我々を捕えて煮て食うという話である。しかしその当時は何という考もなかったから別段恐しいとも思わなかった。ただ彼の掌に載せられてスーと持ち上げられた時何だかフワフワした感じがあったばかりである。掌の上で少し落ちついて書生の顔を見たのがいわゆる人間というものの見始であろう。この時妙なものだと思った感じが今でも残っている。第一毛をもって装饰されべきはずの颜がつるつるしてまるで薬缶だ。その后猫にもだいぶ逢ったがこんな片轮には一度も出会わした事がない。のみならず颜の真中があまりに突起している。そうしてその穴の中から时々ぷうぷうと烟を吹く。どうも咽せぽくて実に弱った。これが人间の饮む烟草というものである事はようやくこの顷知った“。" この書生の掌の裏でしばらくはよい心持に坐っておったが、しばらくすると非常な速力で運転し始めた。書生が動くのか自分だけが動くのか分らないが無暗に眼が廻る。胸が悪くなる。到底助からないと思っていると、どさりと音がして眼から火が出た。それまでは記憶しているがあとは何の事やらいくら考え出そうとしても分らない。" " ふと気が付いて見ると書生はいない。たくさんおった兄弟が一疋も見えぬ。肝心の母親さえ姿を隠してしまった。その上今までの所とは違って無暗に明るい。眼を明いていられぬくらいだ。はてな何でも容子がおかしいと、のそのそ這い出して見ると非常に痛い。吾輩は藁の上から急に笹原の中へ棄てられたのである。" " ようやくの思いで笹原を這い出すと向うに大きな池がある。吾輩は池の前に坐ってどうしたらよかろうと考えて見た。別にこれという分別も出ない。しばらくして泣いたら書生がまた迎に来てくれるかと考え付いた。ニャー、ニャーと試みにやって見たが誰も来ない。そのうち池の上をさらさらと風が渡って日が暮れかかる。腹が非常に減って来た。泣きたくても声が出ない。仕方がない、何でもよいから食物のある所まであるこうと決心をしてそろりそろりと池を左りに廻り始めた。どうも非常に苦しい。そこを我慢して無理やりに這って行くとようやくの事で何となく人間臭い所へ出た。ここへ這入ったら、どうにかなると思って竹垣の崩れた穴から、とある邸内にもぐり込んだ。縁は不思議なもので、もしこの竹垣が破れていなかったなら、吾輩はついに路傍に餓死したかも知れんのである。一樹の蔭とはよく云ったものだ。この垣根の穴は今日に至るまで吾輩が隣家の三毛を訪問する時の通路になっている。さて邸へは忍び込んだもののこれから先どうして善いか分らない。そのうちに暗くなる、腹は減る、寒さは寒し、雨が降って来るという始末でもう一刻の猶予が出来なくなった。仕方がないからとにかく明るくて暖かそうな方へ方へとあるいて行く。今から考えるとその時はすでに家の内に這入っておったのだ。ここで吾輩は彼の書生以外の人間を再び見るべき機会に遭遇したのである。第一に逢ったのがおさんである。これは前の書生より一層乱暴な方で吾輩を見るや否やいきなり頸筋をつかんで表へ抛り出した。いやこれは駄目だと思ったから眼をねぶって運を天に任せていた。しかしひもじいのと寒いのにはどうしても我慢が出来ん。吾輩は再びおさんの隙を見て台所へ這い上った。すると間もなくまた投げ出された。吾輩は投げ出されては這い上り、這い上っては投げ出され、何でも同じ事を四五遍繰り返したのを記憶している。その時におさんと云う者はつくづくいやになった。この間おさんの三馬を偸んでこの返報をしてやってから、やっと胸の痞が下りた。吾輩が最後につまみ出されようとしたときに、この家の主人が騒々しい何だといいながら出て来た。下女は吾輩をぶら下げて主人の方へ向けてこの宿なしの小猫がいくら出しても出しても御台所へ上って来て困りますという。主人は鼻の下の黒い毛を撚りながら吾輩の顔をしばらく眺めておったが、やがてそんなら内へ置いてやれといったまま奥へ這入ってしまった。主人はあまり口を聞かぬ人と見えた。下女は口惜しそうに吾輩を台所へ抛り出した。かくして吾輩はついにこの家を自分の住家と極める事にしたのである。" " 吾輩の主人は滅多に吾輩と顔を合せる事がない。職業は教師だそうだ。学校から帰ると終日書斎に這入ったぎりほとんど出て来る事がない。家のものは大変な勉強家だと思っている。当人も勉強家であるかのごとく見せている。しかし実際はうちのものがいうような勤勉家ではない。吾輩は時々忍び足に彼の書斎を覗いて見るが、彼はよく昼寝をしている事がある。時々読みかけてある本の上に涎をたらしている。彼は胃弱で皮膚の色が淡黄色を帯びて弾力のない不活溌な徴候をあらわしている。その癖に大飯を食う。大飯を食った後でタカジヤスターゼを飲む。飲んだ後で書物をひろげる。二三ページ読むと眠くなる。涎を本の上へ垂らす。これが彼の毎夜繰り返す日課である。吾輩は猫ながら時々考える事がある。教師というものは実に楽なものだ。人間と生れたら教師となるに限る。こんなに寝ていて勤まるものなら猫にでも出来ぬ事はないと。それでも主人に云わせると教師ほどつらいものはないそうで彼は友達が来る度に何とかかんとか不平を鳴らしている。"</pre>
              </div>
             </div>
            </div>
            <p>在词云中可视化文本数据。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>图wordcloud (textData);</pre>
              </div>
             </div>
            </div>
            <div class="informalfigure">
             <div id="d122e9729" class="mediaobject">
              <p><img src="//www.tatmou.com/help/examples/textanalytics/win64/AnalyzeJapaneseTextExample_02.png" alt="" width="560"></p>
             </div>
            </div>
            <h3 class="title" id="AnalyzeJapaneseTextExample-2">标记文件</h3>
            <p>使用标记文本<code class="literal">令人畏缩的鳕文</code>并查看前几个文档。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>文件= tokenizedDocument (textData);文档(1:10)</pre>
              </div>
             </div>
            </div>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeoutput">
               <pre>ans = 10×1 tokenizedDocument: 5令牌:吾輩は猫である2令牌:夏目漱石0令牌:1标记:一11令牌:吾輩は猫である。名前はまだ無い。264令牌:どこで生れたかとんと見当がつかぬ。何でも薄暗いじめじめした所でニャーニャー泣いていた事だけは記憶している。吾輩はここで始めて人間というものを見た。しかもあとで聞くとそれは書生という人間中で一番獰悪な種族であったそうだ。この書生というのは時々我々を捕えて煮て食うという話である。しかしその当時は何という考もなかったから別段恐しいとも思わなかった。ただ彼の掌に載せられてスーと持ち上げられた時何だかフワフワした感じがあったばかりである。掌の上で少し落ちついて書生の顔を見たのがいわゆる人間というものの見始であろう。 この 時 妙 な もの だ と 思っ た 感じ が 今 でも 残っ て いる 。 第 一 毛 をもって 装飾 さ れ べき はず の 顔 が つるつる し て まるで 薬缶 だ 。 その後 猫 に も だいぶ 逢っ た が こんな 片 輪 に は 一 度 も 出会わ し た 事 が ない 。 のみ なら ず 顔 の 真中 が あまりに 突起 し て いる 。 そうして その 穴 の 中 から 時々 ぷうぷうと 煙 を 吹く 。 どうも 咽 せ ぽく て 実に 弱っ た 。 これ が 人間 の 飲む 煙草 という もの で ある 事 は ようやく この 頃 知っ た 。 100 tokens: この 書生 の 掌 の 裏 で しばらく は よい 心持 に 坐っ て おっ た が 、 しばらく する と 非常 な 速力 で 運転 し 始め た 。 書生 が 動く の か 自分 だけ が 動く の か 分ら ない が 無 暗に 眼 が 廻る 。 胸 が 悪く なる 。 到底 助から ない と 思っ て いる と 、 ど さり と 音 が し て 眼 から 火 が 出 た 。 それ まで は 記憶 し て いる が あと は 何 の 事 やら いくら 考え出そ う として も 分ら ない 。 92 tokens: ふと 気 が 付い て 見る と 書生 は い ない 。 たくさん おっ た 兄弟 が 一疋 も 見え ぬ 。 肝心 の 母親 さえ 姿 を 隠し て しまっ た 。 その 上今 まで の 所 と は 違っ て 無 暗に 明るい 。 眼 を 明い て い られ ぬ くらい だ 。 はてな 何 でも 容子 が おかしい と 、 のそのそ 這い出し て 見る と 非常 に 痛い 。 吾輩 は 藁 の 上 から 急 に 笹原 の 中 へ 棄て られ た の で ある 。 693 tokens: ようやく の 思い で 笹原 を 這い出す と 向う に 大きな 池 が ある 。 吾輩 は 池 の 前 に 坐っ て どう し たら よかろ う と 考え て 見 た 。 別に これ という 分別 も 出 ない 。 しばらく し て 泣い たら 書生 が また 迎 に 来 て くれる か と 考え付い た 。 ニャー 、 ニャー と 試み に やっ て 見 た が 誰 も 来 ない 。 そのうち 池 の 上 を さらさら と 風 が 渡っ て 日 が 暮れ かかる 。 腹 が 非常 に 減っ て 来 た 。 泣き たく て も 声 が 出 ない 。 仕方 が ない 、 何 で も よい から 食物 の ある 所 まで ある こう と 決心 を し て そろ り そろりと 池 を 左 り に 廻り 始め た 。 どうも 非常 に 苦しい 。 そこ を 我慢 し て 無理やり に 這っ て 行く と ようやく の 事 で 何となく 人間 臭い 所 へ 出 た 。 ここ へ 這入っ たら 、 どうにか なる と 思っ て 竹垣 の 崩れ た 穴 から 、 とある 邸 内 に もぐり込ん だ 。 縁 は 不思議 な もの で 、 もし この 竹垣 が 破れ て い なかっ た なら 、 吾輩 は ついに 路傍 に 餓死 し た かも 知れ ん の で ある 。 一樹 の 蔭 と は よく 云っ た もの だ 。 この 垣根 の 穴 は 今日 に 至る まで 吾輩 が 隣家 の 三 毛 を 訪問 する 時 の 通路 に なっ て いる 。 さて 邸 へ は 忍び込ん だ ものの これから 先 どうして 善い か 分ら ない 。 その うち に 暗く なる 、 腹 は 減る 、 寒 さ は 寒し 、 雨 が 降っ て 来る という 始末 で もう 一刻 の 猶予 が 出来 なく なっ た 。 仕方 が ない から とにかく 明るく て 暖か そう な 方 へ 方 へ と あるい て 行く 。 今 から 考える と その 時 は すでに 家 の 内 に 這入っ て おっ た の だ 。 ここ で 吾輩 は 彼 の 書生 以外 の 人間 を 再び 見る べき 機会 に 遭遇 し た の で ある 。 第 一 に 逢っ た の が お さん で ある 。 こ… 276 tokens: 吾輩 の 主人 は 滅多 に 吾輩 と 顔 を 合せる 事 が ない 。 職業 は 教師 だ そう だ 。 学校 から 帰る と 終日 書斎 に 這入っ た ぎりほとんど 出 て 来る 事 が ない 。 家 の もの は 大変 な 勉強 家 だ と 思っ て いる 。 当人 も 勉強 家 で ある か の ごとく 見せ て いる 。 しかし 実際 は うち の もの が いう よう な 勤勉 家 で は ない 。 吾輩 は 時々 忍び足 に 彼 の 書斎 を 覗い て 見る が 、 彼 は よく 昼寝 を し て いる 事 が ある 。 時々 読みかけ て ある 本 の 上 に 涎 を たらし て いる 。 彼 は 胃弱 で 皮膚 の 色 が 淡 黄色 を 帯び て 弾力 の ない 不 活溌 な 徴候 を あらわし て いる 。 その 癖 に 大飯 を 食う 。 大飯 を 食っ た 後 で タカジヤスターゼ を 飲む 。 飲ん だ 後 で 書物 を ひろげる 。 二 三 ページ 読む と 眠く なる 。 涎 を 本 の 上 へ 垂らす 。 これ が 彼 の 毎夜 繰り返す 日課 で ある 。 吾輩 は 猫 ながら 時々 考える 事 が ある 。 教師 という もの は 実に 楽 な もの だ 。 人間 と 生れ たら 教師 と なる に 限る 。 こんなに 寝 て い て 勤まる もの なら 猫 に でも 出来 ぬ 事 は ない と 。 それでも 主人 に 云わ せる と 教師 ほど つらい もの は ない そう で 彼 は 友達 が 来る 度 に 何とか かん とか 不平 を 鳴らし て いる 。</pre>
              </div>
             </div>
            </div>
            <h3 class="title" id="AnalyzeJapaneseTextExample-3">获得致辞标签</h3>
            <p>获取令牌详细信息,然后查看前几个令牌的详细信息。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>tdetails = tokendetails(文件);头(Tdetails)</pre>
              </div>
             </div>
            </div>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeoutput">
               <pre>ans =<span class="emphasis"><em>8×8表</em></span>令牌DocumentNumber LineNumber PartOfSpeech引理实体类型语言  ______ ______________ __________ _______ ________ ______________ ______ __________ " 吾輩“1 1字母ja代词“吾輩“走眼”は“1 1”字母ja adpositionは“走眼”猫“1 1字母是名词“猫“走眼”で“1 1字母ja助动词“だ“走眼”ある“1 1字母ja助动词“ある“走眼”夏目“2 1字母是专有名词“夏目”人“漱石“2 1字母是专有名词“漱石”人“一”4 1字母是数字“一”走眼</pre>
              </div>
             </div>
            </div>
            <p>的<code class="literal">PartOfSpeech</code>表中的变量包含标记的词性标记。分别创建所有名词和形容词的词云。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>图idx = tdetails。PartOfSpeech = =<span style="color:#A020F0">“名词”</span>;令牌= tdetails.Token (idx);次要情节(1、2、1)wordcloud(令牌);标题(<span style="color:#A020F0">“名词”</span>) idx = tdetails。PartOfSpeech = =<span style="color:#A020F0">“形容词”</span>;令牌= tdetails.Token (idx);次要情节(1、2、2)wordcloud(令牌);标题(<span style="color:#A020F0">“形容词”</span>)</pre>
              </div>
             </div>
            </div>
            <div class="informalfigure">
             <div id="d122e9758" class="mediaobject">
              <p><img src="//www.tatmou.com/help/examples/textanalytics/win64/AnalyzeJapaneseTextExample_03.png" alt="" width="560"></p>
             </div>
            </div>
            <h3 class="title" id="AnalyzeJapaneseTextExample-4">准备文本数据进行分析</h3>
            <p>删除停止单词。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>= removeStopWords文件(文档);文档(1:10)</pre>
              </div>
             </div>
            </div>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeoutput">
               <pre>ans = 10×1令牌document:2令牌:吾辈猫2令牌:夏目漱石0令牌:0令牌:6令牌:吾辈猫。117令牌:生活とんとんと当つか。薄暗いじめじめニャーニャー泣いいた事。人间という。しかもしかも书生という人间一番番狞悪种族种族煮食う食う恐当というという思わなかっ别恐ららいとも思わ思わ持ち段恐られ思わ思わげ掌何だられフワフワフワフワ掌掌かフワフワフワフワフワフワ掌掌かフワフワフワフワフワフワ掌掌しフワフワフワフワあっ掌しフワフワフワフワあっあっフワフワしフワフワフワフワフワフワフワフワフワフワフワフワフワフワフワフワフワフワいわゆる人间という始あろ。妙をもって装配れべき颜こんなまる出出缶のみなら颜真あまりあまり突起。そうして真中间あまり突起烟も咽吹く。どうも咽せぽく実に。人间饮む烟草というようやく知っ。43代币:书生掌里しばらくよい心持坐っおっ,しばらく非常非常力运転。胸胸に眼眼眼眼に眼眼眼に眼眼迴る暗に眼迴る眼に眼眼。46令牌:ふと付い见る书生。おっ心母亲姿隠し。上涨违っ无にくらい。眼明いらぬくらい。眼なな子,のななおかしいおかしい见る。非常非常痛い急急笹原弃てらららららららら:思い笹原笹原きなきなきなきな坐ったらよかろよかろ池にというたら别别しばらくにというたら别出しばらく书というという别来来来来来来来来考え考え考え考え考え考え考え考え考え考え考え考え考え付い付い付い付い付い付い考え付いというという坐っ付い付い付い付い考えというというというという付い付い考え考えというというという付い付い考えというというという来付い付い考えというというというという来という考えというというという付いという付い考え考えというという来というというという付い考えというというというというというというというという考えというというというというという考え考え考えという考え考え考え考えというという考え考え考え考え考え考えというというというという考え考え考え考えという考え考え考え考え考え考え书考え考え考え考え考え考え考え考え考え考え考え考え考え考え书书という书考え考え书书书考え考え考え考え考え书书书书书书考え考え考え考え考え考え考え考え考え书书书书书书书书书书书书书考え考え考え考え考え书书书书다池さらさら风渡っかかる。腹腹减っ出。仕方,よいよい物こうこう心そろそろりと池迴り始め。我慢非常苦しい迴り。我慢管理やり行くうやく何となく人间臭い出。这入ったら,どうにか思っ竹垣穴,とある邸もぐり込ん竹垣,とある邸もぐり込んなら,吾辈ついに路傍饿死知れなら,吾辈ついによくっ知れ。垣根荫よく云。通讯なっ。暗く,腹减る,寒し,雨降っ来寒し,雨降っとにかくなっなっ仕とにかくとにかく明暖あるい行。考える书生户外人间再び见るべき机会遭遇。书生一次乱暴见る否いきなり眼颈筋颈筋つかん表表否ひもじい眼ねぶっねぶっ天任せ任せ任せひもじい寒いどうしてもももももももも.出出出。。。。。.おさん隙てて。。.おさんおさん隙隙台台就会。 投げ出さ れ 。 吾輩 投げ出さ れ 這い 上り 、 這い 上っ 投げ出さ れ 、 遍 繰り返し 記憶 。 おさん 云う つくづく なっ 。 この間 おさん 馬 偸 んで 返報 やっ 、 やっと 胸 痞 下り 。 吾輩 最後 つまみ出さ れよ 、 主人 騒々しい いい ながら 出 来 。 下女 吾輩 ぶら下げ 主人 向け 宿 なし 小 猫 いくら 出し 出し 御台 上っ 来 困り いう 。 主人 鼻 黒い 毛 撚り ながら 吾輩 顔 しばらく 眺め おっ 、 やがて そん なら 置い やれ といった 奥 這入っ しまっ 。 主人 あまり 聞か ぬ 見え 。 下女 口惜し 吾輩 台所 抛り出し 。 かくして 吾輩 ついに 住 極める 。 122 tokens: 吾輩 主人 滅多 吾輩 顔 合せる 。 職業 教師 。 学校 帰る 終日 書斎 這入っ ぎりほとんど 出 来る 。 大変 勉強 思っ 。 当人 勉強 ごとく 見せ 。 しかし 実際 いう 勤勉 。 吾輩 時々 忍び足 書斎 覗い 見る 、 よく 昼寝 。 時々 読みかけ 本 涎 たらし 。 胃弱 皮膚 色 淡 黄色 帯び 弾力 不 活溌 徴候 あらわし 。 癖 大飯 食う 。 大飯 食っ タカジヤスターゼ 飲む 。 飲ん 書物 ひろげる 。 ページ 読む 眠く 。 涎 本 垂らす 。 毎夜 繰り返す 日課 。 吾輩 猫 ながら 時々 考える 。 教師 という 実に 。 人間 生れ たら 教師 限る 。 こんなに 寝 勤まる なら 猫 出来 ぬ 。 それでも 主人 云わ 教師 つらい 友達 来る 何とか かん 不平 鳴らし 。</pre>
              </div>
             </div>
            </div>
            <p>擦除的标点符号。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>= erasePunctuation文件(文档);文档(1:10)</pre>
              </div>
             </div>
            </div>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeoutput">
               <pre>ANS = 10×1令牌Document:2代币:吾辈猫2代币:夏目漱石0代币:0代币:4令牌:吾辈吾辈まだ无い102代币:生活とんと见当つか薄暗いじめじめニャーニャー泣いい事记忆吾辈じめじめ泣いいた事吾辈始め人间というという闻く书生という人间一番种族种族书生という时代捕え煮食うというしかし当というなかっ别段恐し思わなかっ掌载せられ持ちげら何だかフワフワあっ少し落ちつい书籍颜いわゆる人间という始妙妙いわゆる毛毛毛をもって装装饰べきべきつるつるまるまるでででつるつるつるつるまるで薬出猫逢っこんな片出出のみなら颜真中间あまり突起そう真穴穴に突起そうて穴穴ぷうぷうと烟吹くも咽咽実に弱っ烟どう咽せ実に弱っ人间饮む烟草知っ実に弱っ人间饮む烟草ようやく知っ36令牌:书生掌里しばらくよい心灵持坐っおっおっ非常非常力量运転书生动动画动态分享到暗暗に迴る胸悪く助から思っさりさり音眼记忆考え出そとして音眼眼记忆考えそとしてとしてとしてとしてとしてto to考え考え出として兄弟兄弟疋见え付い书生おっ兄弟见えぬぬ肝肝母亲姿姿しまっ上今违っ无に明星眼明星らぬくらいはてなな子おかしいのそ这い出し非常非常痛い藁笹原弃てられれ吾辈to弃てれれれれto笹原这い出す向う大声池池坐ったらよかろ考え池吾辈坐ったらよかろ考えというにという出たら书生迎来くれる考えニャーニャー试みやっやっ来その池さらさら风渡っ暮れかかる非常减っ来たく声出仕よい东西こうこう心脏そろそろりと池り始めどうどう苦しい苦しい池迴り始めどう苦しい苦しい苦しい我も知れ一树よく云っ垣根穴今今日至る吾辈家人毛访问通道なっさ邸邸もののこれからどうし善い邸忍び込ん暗く腹减る善い雨雨降っ降っという始末もう犹予犹予出なくなっ仕仕明星这入っおっ书生户外人间再び再びべき机会遭遇逢っ书生一串吾辈否やいきなり颈筋つかん表抛り出し思っ眼ねぶっ运天任せしかし寒いどうしてもも任せ任せひもじいどうしも我慢出出再び隙台所这い这い上するともなく投げ出され吾辈投げ出され这い上り上っ投げ出され缲り返しおさん云うつくづくなっこのおさん马偸んで返やっと痞痞吾辈最后つまみれ痞り痞り吾辈最后れよより騒々しいいいいい出れよ吾辈騒々しいいいながら女女吾辈げ 主人 向け 宿 なし 小 猫 いくら 出し 出し 御台 上っ 来 困り いう 主人 鼻 黒い 毛 撚り ながら 吾輩 顔 しばらく 眺め おっ やがて そん なら 置い やれ といった 奥 這入っ しまっ 主人 あまり 聞か ぬ 見え 下女 口惜し 吾輩 台所 抛り出し かくして 吾輩 ついに 住 極める 101 tokens: 吾輩 主人 滅多 吾輩 顔 合せる 職業 教師 学校 帰る 終日 書斎 這入っ ぎりほとんど 出 来る 大変 勉強 思っ 当人 勉強 ごとく 見せ しかし 実際 いう 勤勉 吾輩 時々 忍び足 書斎 覗い 見る よく 昼寝 時々 読みかけ 本 涎 たらし 胃弱 皮膚 色 淡 黄色 帯び 弾力 不 活溌 徴候 あらわし 癖 大飯 食う 大飯 食っ タカジヤスターゼ 飲む 飲ん 書物 ひろげる ページ 読む 眠く 涎 本 垂らす 毎夜 繰り返す 日課 吾輩 猫 ながら 時々 考える 教師 という 実に 人間 生れ たら 教師 限る こんなに 寝 勤まる なら 猫 出来 ぬ それでも 主人 云わ 教師 つらい 友達 来る 何とか かん 不平 鳴らし</pre>
              </div>
             </div>
            </div>
            <p>用词根化文本<code class="literal">normalizeWords</code>.</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>= normalizeWords文件(文档);文档(1:10)</pre>
              </div>
             </div>
            </div>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeoutput">
               <pre>ans = 10×1 tokenizedDocument: 2令牌:吾輩猫2令牌:夏目漱石0令牌:0令牌:4令牌:吾輩猫まだ無い102令牌:生れるとんと見当つくぬ薄暗いじめじめニャーニャー泣くいた事記憶吾輩始める人間というしかも聞く書生という人間一番獰悪種族ある書生という時々捕える煮る食うというしかし当時という考ない別段恐いいとも思うない掌載せるられるスー持ち上げるられる何だかフワフワある掌少し落ちつく書生顔いわゆる人間という始ある妙思う残る毛をもって装飾れるべし顔つるつるまるで薬缶猫だいぶ逢うこんな片出会うのみなる顔真中あまりに突起そうして穴時々ぷうぷうと煙吹くどうも咽するぽい実に弱る人間飲む煙草というようやく知る36令牌:書生掌裏しばらくよい心持坐るおるしばらく非常速力運転始める書生動く動く分る無暗に眼廻る胸悪い到底助かる思うどさる音眼出る記憶いくら考え出すとして分る38令牌:ふと付く見る書生おる兄弟一疋見えるぬ肝心母親姿隠すしまう上今違う無暗に明るい眼明くられるぬくらいはてな容子おかしいのそのそ這い出す見る非常痛い吾輩藁急笹原棄てるられる274令牌:ようやく思い笹原這い出す向う大きな池吾輩池坐るたよい考える別にという分別出るしばらく泣くた書生迎来るくれる考え付くニャーニャー試みやる来るそのうち池さらさら風渡る暮れかかる腹非常減る来る泣くたい声出る仕方よい食物こう決心そるりそろりと池り廻る始めるどうも非常苦しい我慢無理やり這う行くようやく何となく人間臭い出る這入るたどうにか思う竹垣崩れる穴とある邸もぐり込む縁不思議もし竹垣破れるないだ吾輩ついに路傍餓死かも知れる一樹蔭よく云う垣根穴今日至る吾輩隣家毛訪問通路なるさて邸忍び込むもののこれからどうして善い分る暗い腹減る寒い寒い雨降る来るという始末もう一刻猶予出来るないなる仕方とにかく明るい暖かいあるく行く考えるすでに這入るおる吾輩書生以外人間再び見るべし機会遭遇逢う書生一層乱暴吾輩見る否やいきなり頸筋つかむ表抛り出す駄目思う眼ねぶる運天任せるしかしひもじい寒いどうしても我慢出来る吾輩再びおさん隙台所這う上るすると間もなく投げ出すれる吾輩投げ出すれる這う上る這う上る投げ出すれる遍繰り返す記憶おさん云うつくづくなるこの間おさん馬偸んで返報やるやっと胸痞下りる吾輩最後つまみ出す れる 主人 騒々しい いう ながら 出る 来る 下女 吾輩 ぶら下げる 主人 向ける 宿 ない 小 猫 いくら 出す 出す 御台 上る 来る 困る いう 主人 鼻 黒い 毛 撚る ながら 吾輩 顔 しばらく 眺める おる やがて そん だ 置く やる といった 奥 這入る しまう 主人 あまり 聞く ぬ 見える 下女 口惜しい 吾輩 台所 抛り出す かくして 吾輩 ついに 住 極める 101 tokens: 吾輩 主人 滅多 吾輩 顔 合せる 職業 教師 学校 帰る 終日 書斎 這入る ぎりほとんど 出る 来る 大変 勉強 思う 当人 勉強 ごとし 見せる しかし 実際 いう 勤勉 吾輩 時々 忍び足 書斎 覗く 見る よく 昼寝 時々 読みかける 本 涎 たらす 胃弱 皮膚 色 淡い 黄色 帯びる 弾力 不 活溌 徴候 あらわす 癖 大飯 食う 大飯 食う タカジヤスターゼ 飲む 飲む 書物 ひろげる ページ 読む 眠い 涎 本 垂らす 毎夜 繰り返す 日課 吾輩 猫 ながら 時々 考える 教師 という 実に 人間 生れる た 教師 限る こんなに 寝る 勤まる だ 猫 出来る ぬ それでも 主人 云う 教師 つらい 友達 来る 何とか かん 不平 鳴らす</pre>
              </div>
             </div>
            </div>
            <p>一些预处理步骤,例如删除停止单词和擦除标点符号,返回空文档。使用该文件删除空文档<code class="literal">removeEmptyDocuments</code>函数。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>= removeEmptyDocuments文件(文档);</pre>
              </div>
             </div>
            </div>
            <h3 class="title" id="AnalyzeJapaneseTextExample-5">创建预处理函数</h3>
            <p>创建执行预处理的函数可用以相同的方式准备不同的文本数据集合。例如,您可以使用与培训数据相同的步骤进行预处理新数据的函数。</p>
            <p>创建函数授权并预处理要用于分析的文本数据。功能<code class="literal">preprocessjapaneseText.</code>,执行以下步骤:</p>
            <div class="orderedlist">
             <ol style="list-style: decimal;">
              <li><p>使用标记文本<code class="literal">令人畏缩的鳕文</code>.</p></li>
              <li><p>删除标点符号使用<code class="literal">侵蚀</code>.</p></li>
              <li><p>删除列表的停止词(如“あそこ”、“あたり”,和“あちら”)使用<code class="literal">removeStopWords</code>.</p></li>
              <li><p>使使用的词义化<code class="literal">normalizeWords</code>.</p></li>
             </ol>
            </div>
            <p>使用该文件预处理后删除空的文档<code class="literal">removeEmptyDocuments</code>函数。在使用预处理函数后删除文档可以更容易地从其他来源删除相应的数据(如标签)。</p>
            <p>在本例中,使用预处理函数<code class="literal">preprocessjapaneseText.</code>,以准备文本数据。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>文件= preprocessJapaneseText (textData);文档(1:5)</pre>
              </div>
             </div>
            </div>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeoutput">
               <pre>ans = 5×1 tokenizedDocument: 2令牌:吾輩猫2令牌:夏目漱石0令牌:0令牌:4令牌:吾輩猫まだ無い</pre>
              </div>
             </div>
            </div>
            <p>删除空文档。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>= removeEmptyDocuments文件(文档);</pre>
              </div>
             </div>
            </div>
            <h3 class="title" id="AnalyzeJapaneseTextExample-6">符合主题模式</h3>
            <p>为数据拟合一个潜在的Dirichlet分配(LDA)主题模型。LDA模型发现文档集合中的底层主题,并推断主题中的单词概率。</p>
            <p>要使LDA模型适合于数据,首先必须创建词汇包模型。单词袋模型(也称为术语频率计数器)记录单词在集合的每个文档中出现的次数。创建一个词袋模型使用<code class="literal">bagOfWords</code>.</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>袋= bagOfWords(文件);</pre>
              </div>
             </div>
            </div>
            <p>从单词袋模型中删除空文档。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>BAG = RoverimementyDocuments(袋);</pre>
              </div>
             </div>
            </div>
            <p>使用七个主题使用LDA模型<code class="literal">fitlda</code>.要抑制verbose输出,请设置<code class="literal">“详细”</code>来<code class="literal">0</code>.</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>numTopics = 7;mdl = fitlda(袋、numTopics、<span style="color:#A020F0">“详细”</span>,0);</pre>
              </div>
             </div>
            </div>
            <p>使用Word云可视化前四个主题。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>数字<span style="color:#0000FF">为</span>i = 1:4子图(2,2,i)WordCloud(MDL,i);标题(<span style="color:#A020F0">“主题”</span>+ i)<span style="color:#0000FF">结束</span></pre>
              </div>
             </div>
            </div>
            <div class="informalfigure">
             <div id="d122e9857" class="mediaobject">
              <p><img src="//www.tatmou.com/help/examples/textanalytics/win64/AnalyzeJapaneseTextExample_04.png" alt="" width="560"></p>
             </div>
            </div>
            <p>使用堆叠条形图可视化多个主题混合物。随机查看五个输入文档,并可视化相应的主题混合物。</p>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>numDocuments =元素个数(文件);idx = randperm (numDocuments 5);文档(idx)</pre>
              </div>
             </div>
            </div>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeoutput">
               <pre>ans = 5×1 tokenizedDocument: 4令牌:細君細君なかなかさばける7令牌:進行せる山々どうしても暮れるくれる困る13标记:来るそんな仙骨相手少々骨折れる過ぎる宛然たり仙伝人物3令牌:先生譜下さる23个标记:立つ月給上がるいくら勉強褒めるくれる郎君独寂寞中学時代覚える詩句細君朗吟細君ちょっと分るかねる返事</pre>
              </div>
             </div>
            </div>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre>主题模糊=变换(MDL,文档(IDX));图Barh(主题混销(1:5,:),<span style="color:#A020F0">“堆叠”</span>) xlim([0 1]) title(<span style="color:#A020F0">“主题混合”</span>)xlabel(<span style="color:#A020F0">“主题概率”</span>)ylabel(<span style="color:#A020F0">“文档”</span>)传说(<span style="color:#A020F0">“主题”</span>+字符串(1:numtopics),<span style="color:#A020F0">'位置'</span>,<span style="color:#A020F0">“northeastoutside”</span>)</pre>
              </div>
             </div>
            </div>
            <div class="informalfigure">
             <div id="d122e9869" class="mediaobject">
              <p><img src="//www.tatmou.com/help/examples/textanalytics/win64/AnalyzeJapaneseTextExample_05.png" alt="" width="560"></p>
             </div>
            </div>
            <p><strong class="emphasis bold">例子预处理功能</strong></p>
            <p>功能<code class="literal">preprocessjapaneseText.</code>,执行以下步骤:</p>
            <div class="orderedlist">
             <ol style="list-style: decimal;">
              <li><p>使用标记文本<code class="literal">令人畏缩的鳕文</code>.</p></li>
              <li><p>删除标点符号使用<code class="literal">侵蚀</code>.</p></li>
              <li><p>删除列表的停止词(如“あそこ”、“あたり”,和“あちら”)使用<code class="literal">removeStopWords</code>.</p></li>
              <li><p>使使用的词义化<code class="literal">normalizeWords</code>.</p></li>
             </ol>
            </div>
            <div class="code_responsive">
             <div class="programlisting">
              <div class="codeinput">
               <pre><span style="color:#0000FF">功能</span>文件= preprocessJapaneseText (textData)<span style="color:#228B22">标记文本。</span>文件= tokenizedDocument (textData);<span style="color:#228B22">擦掉标点符号。</span>= erasePunctuation文件(文档);<span style="color:#228B22">删除一个停止词列表。</span>= removeStopWords文件(文档);<span style="color:#228B22">将单词义化。</span>文档= normalizeWords(文档,<span style="color:#A020F0">“风格”</span>,<span style="color:#A020F0">“引理”</span>);<span style="color:#0000FF">结束</span></pre>
              </div>
             </div>
            </div>
           </div>
           <h2 id="d122e9905">另请参阅</h2>
           <p><span itemscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso"><a itemprop="url" href="//www.tatmou.com/help/textanalytics/ref/tokenizeddocument.addpartofspeechdetails.html"><span itemprop="name"><code class="function">addpartofspeechdetails.</code></span></a></span>|<span itemscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso"><a itemprop="url" href="//www.tatmou.com/help/textanalytics/ref/normalizewords.html"><span itemprop="name"><code class="function">normalizeWords</code></span></a></span>|<span itemscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso"><a itemprop="url" href="//www.tatmou.com/help/textanalytics/ref/tokenizeddocument.removestopwords.html"><span itemprop="name"><code class="function">removeStopWords</code></span></a></span>|<span itemscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso"><a itemprop="url" href="//www.tatmou.com/help/textanalytics/ref/stopwords.html"><span itemprop="name"><code class="function">秒表</code></span></a></span>|<span itemscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso"><a itemprop="url" href="//www.tatmou.com/help/textanalytics/ref/tokenizeddocument.tokendetails.html"><span itemprop="name"><code class="function">tokenDetails</code></span></a></span>|<span itemscope itemtype="//www.tatmou.com/help/schema/MathWorksDocPage/SeeAlso" itemprop="seealso"><a itemprop="url" href="//www.tatmou.com/help/textanalytics/ref/tokenizeddocument.html"><span itemprop="name"><code class="object">令人畏缩的鳕文</code></span></a></span></p>
           <h2 id="d122e9927">相关主题</h2>
           <ul>
            <li><a href="//www.tatmou.com/help/textanalytics/ug/language-considerations.html" class="a">语言的注意事项</a></li>
            <li><a href="//www.tatmou.com/help/textanalytics/ug/create-simple-text-model-for-classification.html" class="a">为分类创建简单的文本模型</a></li>
            <li><a href="//www.tatmou.com/help/textanalytics/ug/analyze-text-data-using-topic-models.html" class="a">使用主题模型分析文本数据</a></li>
            <li><a href="//www.tatmou.com/help/textanalytics/ug/analyze-text-data-using-multi-word-phrases.html" class="a">使用多词短语分析文本数据</a></li>
            <li><a href="//www.tatmou.com/help/textanalytics/ug/analyze-test-data-using-emojis.html" class="a">分析包含表情符号的文本数据</a></li>
            <li><a href="//www.tatmou.com/help/textanalytics/ug/train-a-sentiment-classifier.html" class="a">训练情感分类器</a></li>
            <li><a href="//www.tatmou.com/help/textanalytics/ug/classify-text-data-using-deep-learning.html" class="a">使用深度学习对文本数据进行分类</a></li>
            <li><a href="//www.tatmou.com/help/deeplearning/ug/generate-text-using-deep-learning.html" class="a">使用深度学习生成文本</a><span role="cross_prod">(深度学习工具箱)</span></li>
           </ul>
          </section>
         </div>
         <div class="modal fade" id="open-example-dialog" tabindex="-1" role="dialog" aria-labelledby="openExampleDialogLabel" aria-hidden="true">
          <div class="modal-dialog">
           <div class="modal-content">
            <div class="modal-header">
             <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×</span></button>
             <h2 class="modal-title">开放的例子</h2>
            </div>
            <div class="modal-body" id="dialog-body">
             <p>在您的系统中存在这个示例的修改版本。你想打开这个版本吗?</p>
            </div>
            <div class="modal-footer">
             <a id="open-example-dialog-replace" class="btn btn_color_blue companion_btn" data-dismiss="modal">不,请覆盖修改后的版本</a>
             <a id="open-example-dialog-continue" class="btn btn_color_blue" data-dismiss="modal">是的</a>
            </div>
           </div>
          </div>
         </div>
         <div class="clearfix"></div>
         <div align="center" class="feedbackblock">
          <iframe id="doc_survey"></iframe>
         </div>
        </section>
        <div class="modal fade" id="matlab-command-dialog" tabindex="-1" role="dialog" aria-labelledby="matlabCommandDialogLabel" aria-hidden="true">
         <div class="modal-dialog">
          <div class="modal-content">
           <div class="modal-header">
            <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×</span></button>
            <h2 class="modal-title">MATLAB命令</h2>
           </div>
           <div class="modal-body" id="dialog-body">
            <p>你点击一个链接对应于这个MATLAB命令:</p>
            <pre id="dialog-matlab-command"></pre>
            <p>通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app</p>
           </div>
           <div class="modal-footer">
            <button type="button" class="btn btn_secondary" data-dismiss="modal">关闭</button>
           </div>
          </div>
         </div>
        </div>
        <div id="location_content" style="display:none;"></div>
        <div class="modal fade" id="country-unselected" tabindex="-1" role="dialog" aria-labelledby="country-unselected-title" translate="no">
         <div id="country-select-container">
          <div class="modal-dialog modal-lg">
           <div class="modal-content">
            <div class="modal-header">
             <button type="button" class="close" data-dismiss="modal" aria-label="Close"><span aria-hidden="true">×</span></button>
             <img alt="MathWorks" src="//www.tatmou.com/images/responsive/global/pic-header-mathworks-logo2.svg" style="width:167px; height:auto;">
            </div>
            <div class="modal-body">
             <div class="row add_margin_40">
              <div class="col-xs-12">
               <h1 class="icon-globe icon_color_secondary" id="country-unselected-title">选择网站</h1>
               <p>选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:<strong class="recommended-country"></strong>.</p>
               <a href="#" id="recommended_domain_button" class="btn btn_color_blue containsResourceName resourceClass-button">选择<span class="recommended-country"></span>网站</a>
              </div>
             </div>
             <p>您还可以从以下列表中选择一个网站:</p>
             <div class="alert alert-warning" id="china_performance_alert" style="display:none;">
              <span class="alert_icon icon-alert-warning"></span>
              <h2>如何获得最佳的网站性能</h2>
              <p>选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。</p>
             </div>
             <div class="row add_margin_30">
              <div class="col-sm-4 col-md-3">
               <h3 class="add_bottom_rule">美洲</h3>
               <ul class="list-unstyled">
                <li><a href="//www.tatmou.com/la" class="domain_selector_link" data-country-code="LA" data-subdomain="la" data-lang="es" data-default-lang="true" data-selected-text="América Latina" data-recommended-text="América Latina" data-do-not-rewrite="true">América拉丁</a>(Español)</li>
                <li><a href="//www.tatmou.com" class="domain_selector_link" data-country-code="CA" data-subdomain="www" data-lang="en" data-do-not-rewrite="true">加拿大</a>(英语)</li>
                <li><a href="//www.tatmou.com" class="domain_selector_link" data-country-code="US" data-subdomain="www" data-lang="en" data-default-lang="true" data-selected-text="United States" data-recommended-text="United States" data-do-not-rewrite="true">美国</a>(英语)</li>
               </ul>
              </div>
              <div class="col-sm-4 col-md-6">
               <h3 class="add_bottom_rule">欧洲</h3>
               <div class="row">
                <div class="col-xs-6 col-sm-12 col-md-6">
                 <ul class="list-unstyled add_margin_0_sm">
                  <li><a href="//www.tatmou.com/nl" class="domain_selector_link" data-country-code="BE" data-subdomain="nl" data-lang="en" data-do-not-rewrite="true">比利时</a>(英语)</li>
                  <li><a href="//www.tatmou.com/se" class="domain_selector_link" data-country-code="DK" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">丹麦</a>(英语)</li>
                  <li><a href="//www.tatmou.com/de" class="domain_selector_link" data-country-code="DE" data-subdomain="de" data-lang="de" data-default-lang="true" data-selected-text="Deutschland" data-recommended-text="Deutschland" data-do-not-rewrite="true">德国</a>(德意志)</li>
                  <li><a href="//www.tatmou.com/es" class="domain_selector_link" data-country-code="ES" data-subdomain="es" data-lang="es" data-default-lang="true" data-selected-text="España" data-recommended-text="España" data-do-not-rewrite="true">西班牙</a>(Español)</li>
                  <li><a href="//www.tatmou.com/se" class="domain_selector_link" data-country-code="FI" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">芬兰</a>(英语)</li>
                  <li><a href="//www.tatmou.com/fr" class="domain_selector_link" data-country-code="FR" data-subdomain="fr" data-lang="fr" data-default-lang="true" data-selected-text="France" data-recommended-text="France" data-do-not-rewrite="true">法国</a>(法语)</li>
                  <li><a href="//www.tatmou.com/uk" class="domain_selector_link" data-country-code="IE" data-subdomain="uk" data-lang="en" data-do-not-rewrite="true">爱尔兰</a>(英语)</li>
                  <li><a href="//www.tatmou.com/it" class="domain_selector_link" data-country-code="IT" data-subdomain="it" data-lang="it" data-default-lang="true" data-selected-text="Italia" data-recommended-text="Italia" data-do-not-rewrite="true">意大利</a>(意大利语)</li>
                  <li><a href="//www.tatmou.com/nl" class="domain_selector_link" data-country-code="LU" data-subdomain="nl" data-lang="en" data-do-not-rewrite="true">卢森堡</a>(英语)</li>
                 </ul>
                </div>
                <div class="col-xs-6 col-sm-12 col-md-6">
                 <ul class="list-unstyled">
                  <li><a href="//www.tatmou.com/nl" class="domain_selector_link" data-country-code="NL" data-subdomain="nl" data-lang="en" data-default-lang="true" data-selected-text="Benelux" data-recommended-text="Netherlands" data-do-not-rewrite="true">荷兰</a>(英语)</li>
                  <li><a href="//www.tatmou.com/se" class="domain_selector_link" data-country-code="NO" data-subdomain="se" data-lang="en" data-do-not-rewrite="true">挪威</a>(英语)</li>
                  <li><a href="//www.tatmou.com/de" class="domain_selector_link" data-country-code="AT" data-subdomain="de" data-lang="de" data-do-not-rewrite="true">奥地利</a>(德意志)</li>
                  <li><a href="//www.tatmou.com" class="domain_selector_link" data-country-code="PT" data-subdomain="www" data-lang="en" data-do-not-rewrite="true">葡萄牙</a>(英语)</li>
                  <li><a href="//www.tatmou.com/se" class="domain_selector_link" data-country-code="Sweden" data-subdomain="se" data-lang="en" data-default-lang="true" data-selected-text="Nordic" data-recommended-text="Sweden" data-do-not-rewrite="true">瑞典</a>(英语)</li>
                  <li>瑞士<ul class="list-unstyled add_indent_20">
                    <li><a href="//www.tatmou.com/ch" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="de" data-selected-text="Schweiz" data-recommended-text="Schweiz" data-do-not-rewrite="true">多伊奇</a></li>
                    <li><a href="//www.tatmou.com/ch" id="swiss_english" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="en" data-default-lang="true" data-selected-text="Switzerland" data-recommended-text="Switzerland" data-do-not-rewrite="true">英语</a></li>
                    <li><a href="//www.tatmou.com/ch" class="domain_selector_link" data-country-code="CH" data-subdomain="ch" data-lang="fr" data-selected-text="Suisse" data-recommended-text="Suisse" data-do-not-rewrite="true">法语</a></li>
                   </ul></li>
                  <li><a href="//www.tatmou.com/uk" class="domain_selector_link" data-country-code="GB" data-subdomain="uk" data-lang="en" data-default-lang="true" data-selected-text="United Kingdom" data-recommended-text="United Kingdom" data-do-not-rewrite="true">英国</a>(英语)</li>
                 </ul>
                </div>
               </div>
              </div>
              <div class="col-sm-4 col-md-3">
               <h3 class="add_bottom_rule">亚太地区</h3>
               <ul class="list-unstyled">
                <li><a href="//www.tatmou.com/au" class="domain_selector_link" data-country-code="AU" data-subdomain="au" data-lang="en" data-default-lang="true" data-selected-text="Australia" data-recommended-text="Australia" data-do-not-rewrite="true">澳大利亚</a>(英语)</li>
                <li><a href="//www.tatmou.com/in" class="domain_selector_link" data-country-code="IN" data-subdomain="in" data-lang="en" data-default-lang="true" data-selected-text="India" data-recommended-text="India" data-do-not-rewrite="true">印度</a>(英语)</li>
                <li><a href="//www.tatmou.com/au" class="domain_selector_link" data-country-code="NZ" data-subdomain="au" data-lang="en" data-do-not-rewrite="true">新西兰</a>(英语)</li>
                <li>中国<ul class="list-unstyled add_indent_20">
                  <li><a href="https://ww2.mathworks.cn" class="domain_selector_link" data-country-code="CN" data-subdomain="ww2" data-lang="zh" data-default-lang="true" data-selected-text="中国" data-recommended-text="中国" data-do-not-rewrite="true">简体中文</a></li>
                  <li><a href="https://ww2.mathworks.cn" class="domain_selector_link" data-country-code="CN" data-subdomain="ww2" data-lang="en" data-default-lang="true" data-selected-text="China" data-recommended-text="China" data-do-not-rewrite="true">英语</a></li>
                 </ul></li>
                <li><a href="//www.tatmou.com/jp" class="domain_selector_link" data-country-code="JP" data-subdomain="jp" data-lang="ja" data-default-lang="true" data-selected-text="日本" data-recommended-text="日本" data-do-not-rewrite="true">日本语</a>(日本语)</li>
                <li><a href="//www.tatmou.com/kr" class="domain_selector_link" data-country-code="KR" data-subdomain="kr" data-lang="ko" data-default-lang="true" data-selected-text="한국" data-recommended-text="한국" data-do-not-rewrite="true">한국</a>(한국어)</li>
               </ul>
              </div>
             </div>
             <p class="text-center"><a href="#" class="worldwide_link">与当地办事处联系</a></p>
            </div>
           </div>
          </div>
         </div>
        </div>
       </div>
      </div>
     </div>
    </div>
    <!-- MOBILE CTA - Begin -->
    <div class="cta_container_mobile visible-sm visible-xs">
     <div class="container-fluid">
      <div class="row">
       <div class="col-xs-12">
        <div class="cta_box">
         <ul class="list-inline">
          <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tatmou.com/campaigns/products/trials.html?prodcode=TA&s_iid=doc_trial_TA_tb" class="icon-download">试用软件</a></li>
          <li class="hidden-lg hidden-md "><a href="//www.tatmou.com/campaigns/products/trials.html?prodcode=TA&s_iid=doc_trial_TA_tb" class="btn btn_color_blue btn-block"><span class="icon-download"></span>试用软件</a></li>
          <li class="cta_item cta_item_general hidden-sm hidden-xs "><a href="//www.tatmou.com/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="icon-download">产品更新</a></li>
          <li class="hidden-lg hidden-md "><a href="//www.tatmou.com/support/web_downloads_bounce.html?s_cid=1008_degr_docdn_270055" class="btn btn_color_blue btn-block"><span class="icon-download"></span>产品更新</a></li>
         </ul>
        </div>
       </div>
      </div>
     </div>
    </div>
    <!-- MOBILE CTA - End -->
    <!-- BODY TRAIL - Begin -->
    <div class="body_trail_container">
     <div class="container-fluid">
      <div class="row">
       <div class="col-xs-12">
        <div class="row">
         <div class="col-xs-12 col-sm-4">
          <h2><a href="//www.tatmou.com/help/textanalytics/index.html?s_cid=doc_ftr">文本分析工具箱文档</a></h2>
          <ul class="list-unstyled hidden-xs">
           <li><a href="//www.tatmou.com/help/textanalytics/examples.html?s_cid=doc_ftr">例子</a></li>
           <li><a href="//www.tatmou.com/help/textanalytics/referencelist.html?type=function&s_cid=doc_ftr">功能</a></li>
           <li><a href="//www.tatmou.com/help/textanalytics/release-notes.html?s_cid=doc_ftr">发布说明</a></li>
           <li><a href="//www.tatmou.com/help/pdf_doc/textanalytics/index.html?s_cid=doc_ftr">PDF文档</a></li>
          </ul>
         </div>
         <div class="col-xs-12 col-sm-4">
          <h2><a href="//www.tatmou.com/support.html?s_cid=doc_ftr">金宝app</a></h2>
          <ul class="list-unstyled hidden-xs">
           <li><a href="//www.tatmou.com/matlabcentral/answers/index?s_cid=doc_ftr">MATLAB的答案</a></li>
           <li><a href="//www.tatmou.com/support/install-matlab.html?s_cid=doc_ftr">安装帮助</a></li>
           <li><a href="//www.tatmou.com/support/bugreports/?s_cid=doc_ftr">错误报告</a></li>
           <li><a href="//www.tatmou.com/support/requirements/product-requirements-platform-availability-list.html?s_cid=doc_ftr">产品要求</a></li>
           <li><a href="//www.tatmou.com/downloads/?s_cid=doc_ftr">软件下载</a></li>
          </ul>
         </div>
         <div class="col-xs-12 col-sm-4">
          <div class="panel panel_color_transparent panel_color_fill">
           <div class="panel-body">
            <div class="thumbnail add_margin_5">
             <a href="//www.tatmou.com/campaigns/offers/text-analytics-with-matlab-white-paper.html?s_iid=doc_wo_TA_footer"><img class="fluid_image" alt="入门文本分析在MATLAB" src="//www.tatmou.com/content/dam/mathworks/mathworks-dot-com/images/responsive/supporting/campaigns/products/getting-started-with-text-analytics-interactive-ebook-thumbnail.jpg"></a>
            </div>
            <h4><a href="//www.tatmou.com/campaigns/offers/text-analytics-with-matlab-white-paper.html?s_iid=doc_wo_TA_footer">入门文本分析在MATLAB</a></h4>
            <a class="icon-download" href="//www.tatmou.com/campaigns/offers/text-analytics-with-matlab-white-paper.html?s_iid=doc_wo_TA_footer">立即下载</a>
           </div>
          </div>
         </div>
        </div>
       </div>
      </div>
     </div>
    </div>
    <!-- BODY TRAIL - End -->
    <footer id="footer" class="bs-footer">
     <!-- FAT FOOTER - Begin -->
     <div class="container-fluid">
      <div class="fat_footer_container">
       <div class="execmatlabweb">
        <!--Requried for Doc Test -->
        <div class="row">
         <div class="col-xs-12 col-md-12 col-lg-9 col-lg-push-3 add_margin_20">
          <div class="row">
           <div class="col-xs-12 col-sm-2">
            <p class="ff_section_title">探索产品下载188bet金宝搏</p>
            <ul class="list-unstyled">
             <li><a href="//www.tatmou.com/products/matlab.html?s_tid=hp_ff_p_matlab">MATLAB</a></li>
             <li><a href="//www.tatmou.com/products/simulink.html?s_tid=hp_ff_p_simulink">金宝app</a></li>
             <li><a href="//www.tatmou.com/products/matlab/student.html?s_tid=hp_ff_p_student">学生的软件</a></li>
             <li><a href="//www.tatmou.com/hardware-support/home.html?s_tid=hp_ff_p_hwsupport">硬件支持金宝app</a></li>
             <li><a href="//www.tatmou.com/matlabcentral/fileexchange/?s_tid=hp_ff_p_fx">文件交换</a></li>
            </ul>
           </div>
           <div class="col-xs-12 col-sm-2">
            <p class="ff_section_title">尝试或购买</p>
            <ul class="list-unstyled">
             <li><a href="//www.tatmou.com/downloads/web_downloads/?s_iid=hp_ff_t_downloads">下载</a></li>
             <li><a href="//www.tatmou.com/campaigns/products/trials.html?s_iid=hp_ff_p_trial">试用软件</a></li>
             <li><a href="//www.tatmou.com/company/aboutus/contact_us/contact_sales.html?s_iid=hp_ff_t_sales">联系销售</a></li>
             <li><a href="//www.tatmou.com/pricing-licensing.html?s_iid=hp_ff_t_pricing">定价和许可</a></li>
             <li><a href="//www.tatmou.com/store/?s_tid=hp_ff_t_buy">如何购买</a></li>
            </ul>
           </div>
           <div class="col-xs-12 col-sm-2">
            <p class="ff_section_title">学习使用</p>
            <ul class="list-unstyled">
             <li><a href="//www.tatmou.com/help/?s_tid=hp_ff_l_doc">文档</a></li>
             <li><a href="//www.tatmou.com/support/learn-with-matlab-tutorials.html?s_tid=hp_ff_l_tutorials">教程</a></li>
             <li><a href="//www.tatmou.com/help/examples.html?s_tid=hp_ff_l_examples">例子</a></li>
             <li><a href="//www.tatmou.com/videos.html?s_tid=hp_ff_l_videos">视频和网络研讨会</a></li>
             <li><a href="//www.tatmou.com/services/training.html?s_tid=hp_ff_l_training">培训</a></li>
            </ul>
           </div>
           <div class="clearfix" id="offcanvas_clearfix" style="display:none"></div>
           <div class="col-xs-12 col-sm-2">
            <p class="ff_section_title">得到支持金宝app</p>
            <ul class="list-unstyled">
             <li><a href="//www.tatmou.com/support/install-matlab.html?s_tid=hp_ff_s_install">安装帮助</a></li>
             <li><a href="//www.tatmou.com/matlabcentral/answers/index?s_tid=hp_ff_s_answers">答案</a></li>
             <li><a href="//www.tatmou.com/services/consulting.html?s_tid=hp_ff_s_consulting">咨询</a></li>
             <li><a href="//www.tatmou.com/licensecenter/?s_tid=hp_ff_s_license">许可证中心</a></li>
             <li><a href="//www.tatmou.com/support/contact_us.html?s_tid=hp_ff_s_support">联络支持金宝app</a></li>
            </ul>
           </div>
           <div class="col-xs-12 col-sm-2">
            <p class="ff_section_title">关于<span translate="no">MathWorks</span></p>
            <ul class="list-unstyled">
             <li><a href="//www.tatmou.com/company/jobs/opportunities.html?s_tid=hp_ff_a_careers">职业生涯</a></li>
             <li><a href="//www.tatmou.com/company/newsroom.html?s_tid=hp_ff_a_newsroom">编辑部</a></li>
             <li><a href="//www.tatmou.com/company/aboutus/soc_mission.html?s_tid=hp_ff_a_socialmission">社会使命</a></li>
             <li><a href="//www.tatmou.com/company/aboutus/contact_us/contact_sales.html?s_tid=hp_ff_a_sales">联系销售</a></li>
             <li><a href="//www.tatmou.com/company.html?s_tid=hp_ff_a_company">关于<span translate="no">MathWorks</span></a></li>
            </ul>
           </div>
          </div>
         </div>
         <div class="col-xs-12 col-md-12 col-lg-3 col-lg-pull-9">
          <p class="h4 add_font_futura_medium add_margin_0"><span translate="no">MathWorks</span></p>
          <p><em>加快工程与科学的步伐</em></p>
          <p><span translate="no">MathWorks</span>是为工程师和科学家开发数学计算软件的领先公司。</p>
          <p><a href="//www.tatmou.com/discovery.html?s_tid=all_disc_mw_ff">发现……</a></p>
         </div>
        </div>
       </div>
      </div>
     </div>
     <!-- FAT FOOTER - End -->
     <div class="container-fluid">
      <div class="footer" translate="no">
       <div class="row">
        <div class="col-xs-12 col-md-9">
         <ul class="countrynav" id="countrynav">
          <li class="footernav_country"><a href="#" data-toggle="modal" data-target="#country-unselected"><span class="icon-globe icon_color_quinary icon_16"></span>美国</a></li>
         </ul>
         <div class="clearfix"></div>
         <ul class="footernav">
          <li class="footernav_patents"><a href="//www.tatmou.com/company/aboutus/policies_statements/patents.html?s_tid=gf_pat">专利</a></li>
          <li class="footernav_trademarks"><a href="//www.tatmou.com/company/aboutus/policies_statements/trademarks.html?s_tid=gf_trd">商标</a></li>
          <li class="footernav_privacy"><a href="//www.tatmou.com/company/aboutus/policies_statements.html?s_tid=gf_priv">隐私政策</a></li>
          <li class="footernav_piracy"><a href="//www.tatmou.com/company/aboutus/policies_statements/piracy.html?s_tid=gf_pir">防止盗版</a></li>
          <li class="footernav_status"><a href="//www.tatmou.com/status/?s_tid=gf_application">应用程序状态</a></li>
         </ul>
         <div class="clearfix"></div>
         <div class="clearfix"></div>
         <p class="copyright" translate="no">金宝app</p>
        </div>
        <div class="clearfix visible-sm add_margin_10"></div>
        <div class="col-xs-12 col-md-3">
         <div class="social_media">
          <ul class="social_media_icons">
           <li><a href="https://www.facebook.com/MATLAB" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tatmou.com/images/responsive/global/ico-facebook.svg" alt="Facebook." class="ico_facebook"></a></li>
           <li><a href="https://www.twitter.com/MATLAB" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tatmou.com/images/responsive/global/ico-twitter.svg" alt="推特" class="ico_twitter"></a></li>
           <li><a href="https://www.instagram.com/matlab/" class="svg_link" target="_blank" rel="nofollow noopener noreferrer"><img class="ico_instagram" alt="Instagram" src="//www.tatmou.com/images/responsive/global/ico-instagram.svg"></a></li>
           <li><a href="https://www.youtube.com/user/MATLAB" class="svg_link" target="_blank" rel="nofollow noopener noreferrer"><img class="ico_youtube" alt="YouTube" src="//www.tatmou.com/images/responsive/global/ico-youtube.svg"></a></li>
           <li><a href="https://www.linkedin.com/company/the-mathworks_2" target="_blank" rel="nofollow noopener noreferrer" class="svg_link"><img src="//www.tatmou.com/images/responsive/global/ico-linkedin.svg" alt="LinkedIn" class="ico_linkedin"></a></li>
           <li><a href="//www.tatmou.com/company/rss.html" class="svg_link"><img src="//www.tatmou.com/images/responsive/global/ico-rss.svg" alt="RSS" class="ico_rss"></a></li>
          </ul>
          <div class="clearfix"></div>
          <p><em>加入谈话</em></p>
         </div>
        </div>
       </div>
      </div>
      <div id="cookie-banner-text" style="display:none;"></div>
      <!-- BEGIN Adobe DTM -->
      <!-- END Adobe DTM -->
     </div>
    </footer>
   </div>
  </div>
  <!-- CRUX 2.0 -->
 </body>
</html>