たつをの日記 - 1998年4月8日

26歳
昨日は誕生日。だんだん歳をとるのが速く感じられる今日この頃。

計算機環境
 最近 fennel が重い。ふと見ると load average が 19。昨日は 20 越えてたりしてたぞ。うーん、なんなんだろ。
 話は変わって、Netscape への日本語入力だけど、ここ数週間、漢字の変換をしてくれない。Wnn6 の辞書が見えてないらしい。いろいろやってみたが原因不明。 こんなの考えて分かる問題じゃないし、そのうち何とかなるでしょ。
 cherry の /home13 がいっぱいになったので、/home12 に引っ越しました。
/home13/tatuo-y/ → /home12/tatuo-y/
「飛ぶ鳥、後を濁さず」というわけで、/home13/tatuo-y/ は空っぽになりました。 思えば、cherry:/home11/tatuo-y/ を作成してもらったのが1996年11月29日。 その約半年後(正確な日付は分からず)/home11 がいっぱいになったから /home13 に移ったんだっけ。 そろそろ /home13 も住みにくくなったので、今度は /home12 というわけ。 でも、今見てみると /home11 なんか結構空きがある。 /home12 が住みにくくなったら、最初の /home11 に戻るかな。 寄生虫みたい。

奨学金貸与希望の理由
博士前期課程の2年間、日本育英会の奨学金の貸与を受けることができ、 充実した研究生活を送ることが出来ました。 しかし、昨年度、博士後期課程に進学した際、 不覚にも奨学金の申請が遅れ、奨学金の貸与を受けることが出来ませんでした。 そのため、この一年親もとに負担をかけつづけ、このままでは、 本年度はアルバイト等を行なう必要があり、 研究に支障をきたすおそれがあります。 勉学・研究に集中するためにも是非奨学金の貸与をお願いします。
...かなりまぬけ

今日の夕食
レンジかぼちゃと怪しいスープ

接尾問題について(2)
 昨日の話は論理的に不適切な部分もあったけれども(曖昧性の増加は本質的な問題ではない)、 まあ、そのうちちゃんとまとめるのでお見逃し下さいませ。
 北方にお住いのY氏から、
「報道部」の「部」は名詞。「解析部」の「部」は接尾辞(だと思う)。 前者は「その部」がOKだが、後者はダメ。
との御意見を頂きました。これは世の中的(?)に正しい認識だと思います。 部署の「部(ぶ)」と部分の「部(ぶ)」。この二つはそもそも意味が違う。
 しかーし!世間の常識からずれていようと、我々は
形態素解析では意味を扱わない(固有名詞は例外)。
という方針に則り、これらの「部(ぶ)」をごちゃまぜにしてしまうのだ (この場合、意味の違いと品詞の違いが連動しているから混乱する)。 で、改めて考えてみると、 「報道部」「解析部」の「部」はは接尾辞、「その部」の「部」は名詞となる。 でも読みがいっしょなんだから同じ単語って考えて(ちょっと乱暴なんだけど)、 名詞に統一してしまう。
 なぜ形態素解析で意味を扱わないかというと、 意味的な曖昧性の解消のために、 シソーラスとか使ったりして面倒なことをやらねばならんからなのだ。 そんなこと形態素解析の段階でやるのはやなこった。 正直言って、もうこれ以上、言語情報を形態素解析システムに導入したくないのだ。 小さくまとまりたいって感じ。 意味の違いの識別とかの処理は、形態素解析のあとで行なうべし。 というか、意味の違いまで認識するようなシステムを構築する際に形態素解析システムを部品として利用するという方向で世の中進んで欲しい。 そのためにも形態素解析システムってのは単純明解で軽快であるべきなのだ! なんでもかんでもやらすのはよくないぞ。
 話は変わるが、そもそも形態素解析用の辞書では、 接尾辞なんてなくして、みんな名詞にしとけばすっきりすると思う。 で、接尾の位置(名詞連続の最後、連用形の後など)に現れたら「接尾辞」というふうに後処理で変換したらいいんじゃない。 この辺は、茶筌フィルター「茶漉(ちゃこし)」の出来にかかってるな。 でも、「これは接尾辞だ」って分かったところで何に使うのかな? 言語統計ぐらいにしか使わないような気がする。

今日の作業
[SUFARY 2.0b2] NT氏のアドバイスにより、 sa_getline(), sa_getkatamari() の仕様変更を行なう。 今までは文字列バッファを用意してやる必要があったが、 これからはポインタだけでOK。
Old:
  char *s;
  s = (char *)alloca(10000);
  sa_getline(ary, pos, s);
  printf("%s", s);
New:
  char *s;
  s = sa_getline(ary, pos);
  printf("%s\n", s);
  free(s);

まとめ
結局、寮から一歩も外へ出なかった。雨だもんね。 これが、SOHO ってやつさ(本当か?)。 明日は奨学金の書類を提出しないといけないから、外出せねば。