2007年11月14日水曜日

日本語という特殊な道具

 最近,英会話教室の英語文(日記?)を書いていく宿題で講師の方にパラグラフを使って書くようにと指示をうけました(もっと長く書けという目的…).「パラグラフ=段落」ぐらいの意識だったのですがちょっと調べてみて目から鱗でした.

パラグラフの重要性とその書き方
http://www.logicalskill.co.jp/jwriting/paragraph.html
多くの日本人は、パラグラフがなんだか知りません。「かなり長いこと書いたから、そろそろ改行しようか」程度の認識の人が圧倒的です。

全く同じトピックについて二つ以上のパラグラフが割り当てられたり、逆に、一つのパラグラフの中に、二つ以上のトピックが述べられていることはありません。


 で,先ほどfeuさんがtwitterで書かれていたMacの要約サービスを指摘していて思い立ちました.「そうか,パラグラフがキチンとしていればある程度,要約サービスってまともに動くのかな.」と.
Twitter / feu
http://twitter.com/feu/statuses/414092632
macに要約サービスなる機能があることに今はじめて気づいた!


 また,以前の調べたMySQLのFULLTEXT機能が日本語では利用できないという点に付いてもあわせて思い出し,タイトルのようなことを思った次第です.
たたみラボ
MySQLで全文検索 - FULLTEXTインデックスの基礎知識
使用にあたっての制約
http://www.tatamilab.jp/rnd/archives/000389.html#b
対象文章は単語ごとにデリミタ文字 [ ,.] で区切られている必要あり。 つまり日本語はそのままでは検索できません (対策は後述)。


 これら二つの条件(パラグラフと段落が必ずしも一致したものではない,単語が明確に分離されない書き方)は日本人の自分からするとそれほどおかしな事では無いが,要約や全文検索へのアプローチ(要約アプリの動きだけだけど)を見て改めて日本語って特殊(独特)とおもう話だった.

という長ーいツブヤキ.

0 件のコメント: