セミナー

今日は、XMLのDOMプログラムをSAXに変換する話と、PHPスクリプトの出力がXHTMLDTDに適合しているかをスクリプトを検査して得られる出力を近似した文脈自由文法を検査して確認する話。

DOMプログラムの変換の人の話は、特にどうということもなく。まだ動くプログラムがないみたいで、多少退屈な発表だった。XMLのパースを高速にしたいという要求は多いんだろうけど、挙げた例が悪かったなーと。住所録のXMLが大企業だとえらい巨大になるという例に、当然のようにRDB使いなさいという突っ込みが入ってた。回答は「XMLはテキストだから人間が編集できる点でメリットがある」というもの。ほー10万件の住所録を手で編集するのかい。あほか。まあ、緊急時にはedで編集できるというのはメリットかもしれないけど、そんなんの前にシステム復旧しろという話しだしなあ。

PHPスクリプトの話はうちの研究室の先輩なのでコメントしづらい(どういう理由だ?)。先日の発表練習で、「オフィスのクリップアートは安っぽいから、IEのアイコンにかえてみたらどうか」とちょうどうでもいいコメントをしたら、ほんとにIEのアイコンになっていた。ほんとにそう思っていますが。新城先生が、「XHTMLDTDは適当に書いたサブセット」だと思っていたみたいで、とんちんかんな質問をしているように見えたのがうけた*1。そういや細かいことだけど、well formedというのは、XMLの文法に則しているという意味だけで、XHTMLになっているかどうかはわからないので、プログラムの出力として不適当だと思った。あとでコメントしよう。

*1:(ちょっと編集してあるかもしれませんが)DTDは基本的にはフルセットです