xmlgawk

xmlgawkというツールについて小耳に挟んだのでメモ。まだ使えるものが存在する段階ではないのですが、gawkに興味深い機能を多数盛り込んだものです。日本 GNU AWK ユーザー会の発表からその特徴を引用しておきます。

xmlgawk は、Juürgen Kahrs 氏らが中心となり、現 gawk メンテナーの Arnold Robbins 氏が gawk に今後組み込もうと考えていることを先行して開発することを目的として開発されているものです。特徴としては以下のようなものがあります。

  • XML 対応 (node 単位でフィールドを扱える)
  • XML に関して入出力は UTF-8 だけでなく、EUC-JP も使用可能
  • PostgreSQL データベースの読み込み
  • gawk からのフォークではなく、先行開発

名前が示すとおり、xmlに対応というところが大きなポイントですが、データベース読み込みというのはなかなか面白い試みだと思いました。たしかにフィールド単位での操作を中心とするawkにとってデーターベースはまさにうってつけの操作対象です。先行開発とのことなのでいずれ本家にマージされる予定があるということでしょう。楽しみです。
そういえば先日、ベル研究所のUnix部門が解散とかいう話が大きく取り扱われていました。既にオリジナルのawk開発者達はそれぞれに企業や研究所に移ったり引退したりしているとのこと。Unixの黎明期を支え続けてきたawkも新らしい道を歩み始めたということでしょうね。感慨深いものがあります。
awk以外の古典的なツールも地道にバージョンアップを重ねていたりするのでたまにはチェックしてみるのも面白いかもしれません。例えばgrepにはPerl互換の正規表現が使えるモードが追加されてたり、構造化テキスト検索に便利なsgrepが派生してたりします。