たつをの日記 - 1998年5月14日

今日の出来事
ここ数日、SFCのクロノトリガーなんかやっててどうも徹夜ぎみで、 生活サイクルがまたおかしくなってしまいました。 14時起床。 4/14の健康診断の結果が返ってきました。 コレステロールが高い...。とはいうものの至って健康。 夕食は、かまどや弁当でした。 そういえば昨日は床屋(理容まどか)に行きました。 帰りにそこらへんで昼飯でも食べようかと思ったんだけど、 2時半という半端な時間だったためどこも準備中でした。

今日の作業
百舌 --- 低レベルな自然言語処理のためのライブラリ
SUFARYのときもそうだったが、 ライブラリ化作業の途中で様々なアプリケーションでライブラリを使ってしまうので、 仕様を変更したら全てのアプリケーションを修正しなければならなくなる。 ああ、めんどくさ。 でも、ライブラリのデバグも兼ねてると考えればしょうがないか。
  • 一つの辞書エントリに付加情報として他のエントリへのリファレンスを持たせるようにした。連語や複合名詞に利用する予定。
  • 辞書エントリ解析用にワイルドカード形態素を作成。

SUFARY --- 高速文字列検索ライブラリ
SUFARYでの複数ファイルに関する私の見解(メールより引用)。
技術的には、suffix array で複数ファイルを検索することは可能です(複数ファイルに対して、一つの array ファイルを作成する)。しかし、array ファイルにファイル識別のための付加情報を加える必要があることと複数の検索対象ファイルを同時にオープンをする必要があるので、処理効率があまり期待できないかもしれません。複数ファイルを仮想的な一つのファイルとして扱える機構があれば楽なのですが...