そらもよう
 


2003年12月31日 7年目の大晦日
青空文庫がスタートしてから、7回目の大晦日を迎える。去年と違って、あまり派手な話題はないけれど、それでも今年1年、いろいろなことがあった。
去年の大晦日にも触れた「入力・校正の受付システム」が、8月に稼働を開始したのが、今年の最大のニュースだろう。これで、入力から校正を経て公開に至るまでの、データベースを基盤とした一連の流れが、ひととおり整ったことになる。システム稼働前は、入力開始のメールをいただいた後、底本の出版社や版数、仮名遣いなどを確認するため、何度もメールのやりとりを重ねることがあった。受付システムのスタートで、こういったロスがずいぶん減ったことを実感している。
少し気になるのは、システムで申請をいただいているのに、「同意します」のメールが届いていないケースが、何件かあることだ。また、メールのみが届いて、受付システムへの申請がないケースもある。せっかく申し入れていただいたお気持ちを無にすることがないように、はじめての申請の際には、必ず同時に「同意します」のメールをお送りいただけるよう、この場を借りて、改めてお願いしておきたい。
7周年を迎えて、青空文庫の周辺にも、新しい動きが出てきた。7年目に突入した7月7日、もと呼びかけ人のagさんが主宰するaozora blogがスタート。青空文庫から少しだけ距離を置いた、けれどもしっかりつながりのある、言ってみれば「きょうだい」ではなく「いとこ」のようなサイトだ。こんなスタンスのサイトが、青空文庫のまわりに増えてくれば、きっと楽しいだろう。「デジタルテキストを蓄積する場」としての青空文庫のシステムは、少しずつ整いつつある。こんどはそこから、外に向かって拡がっていく時期にさしかかってきているのかもしれない。
新しい年も、青空文庫は、一歩ずつ前進していく。引き続き、どうぞよろしく。(LC)

2003年12月21日 芥川「悠々荘」、中島「弟子」、岡本「生々流転」、南方「十二支考」ご担当へのお願い
芥川竜之介「悠々荘」の校正をご担当いただいている方。
中島敦「弟子」の校正をご担当いただいている方。
岡本かの子「生々流転」の入力と校正をご担当いただいている皆さん。
南方熊楠「十二支考 03 田原藤太竜宮入りの話」の校正をご担当いただいている方。
目覚ましプロジェクトから、進捗状況とお気持ちの確認のため、皆さんにメールを送りましたが、不達でした。
reception@aozora.gr.jp宛に、ご一報をお願いします。

本日から一ヶ月、ご連絡を待ちます。
一月を経て、連絡を取り合えない場合は、「入力」を「入力取り消し」に、「校正中」を「校正待ち」に戻します。

なお、11月13日にここで呼びかけたものに関しては、結局どなたとも連絡がとれず、一歩前の状態に戻す措置をとりました。
これらの多くに、さっそく新しい方が担当を名乗り出てくださいました。
ありがとう。(倫)

2003年11月13日 太宰「朝」「葉桜と魔笛」、寺田「俳諧瑣談」、芥川「三つの宝」「三つのなぜ」「三つの窓」、賢治「グスコーブドリの伝記」ご担当へのお願い
太宰治「朝」「葉桜と魔笛」の入力をご担当いただいている方。
寺田寅彦「俳諧瑣談」の入力をご担当いただいている方。
芥川竜之介「三つの宝」「三つのなぜ」「三つの窓」の校正をご担当いただいている方。
宮沢賢治「グスコーブドリの伝記」の校正をご担当いただいている方。
目覚ましプロジェクト(2003年10月21日付けの「長期「作業中」作品の進捗状況を問い合わせ」を参照)から、進捗状況とお気持ちの確認のため、皆さんにメールを送りましたが、不達でした。
reception@aozora.gr.jp宛に、ご一報をお願いします。

本日から一ヶ月、ご連絡を待ちます。
一月を経て、連絡を取り合えない場合は、「入力」を「入力取り消し」に、「校正中」を「校正待ち」に戻します。(倫)

2003年10月21日 長期「作業中」作品の進捗状況を問い合わせ
青空文庫の作業には、締め切りを設けていない。
だから、取りかかってかなり時間がたったものについても、これまでは特別の事情がない限り、進み具合を問い合わせてこなかった。
文庫開設以来、ずっとこの方針できたから、もう六年以上になる。
その間に、長く「作業中」の続く作品が出てきた。
ぽつぽつ寄せられていた、「作業を引き継げないか」、「公開はいつになるだろう」といった問い合わせが、ここにきて少し増えてきたと思う。
先延ばししてきた、進捗状況の確認に取り組む、潮時なのだろう。

問い合わせはまず、1990年代に入力、校正がはじまったものを対象として、入れてみる。
「締め切りなし」という原則には、変更はない。
やりとげたいという意思が示されれば、引き続いて待つ。
ただ、事情が変わって、作業を続けにくくなっているようなら、この際思い切って手放すことも、提案してみたい。
複数の担当作品の内、一部は継続し、残りは手放すという形でも、もちろんかまわない。
だいじょうぶ。
仲間の手に委ねることもまた、共用ファイルの拡充に向けた確かな貢献になる。

いわゆるブロードバンドの普及で、アドレスが変わった人が多いのだろう。
世話役が把握しているもので、連絡の付かないケースが増えている。(アドレスの変わった方、どうぞ reception@aozora.gr.jp 宛にご連絡を。)
今回の問い合わせでメールが届かなかった際は、ここ「そらもよう」で一報を乞い、一ヶ月たっても連絡が取り合えなかったら、別の方が引き継げるよう、対処しようと思う。
「入力中」は、「入力取り消し」にあらため、「校正中」は「校正待ち」に戻し、これまでの方は、担当者という立場からは、外れてもらう。

自分がどんな作品を、いつから抱えているのか、たやすく確認できる資料がある。
「総合インデックス」の「作業中の作品」、「作家別」の下にある、「全てを表示」という項目をクリックして欲しい。
開かれたページの上にある、「→「作業中 作家別作品一覧:全て(CSV形式、 zip圧縮)」をダウンロード」をクリックすると、一枚の大きな表が圧縮して送られてくる。
解凍したものを、エクセルなどの表計算ソフトで開いてみよう。
「入力者名」や「校正者名」の列を、自分の工作員名で検索してみれば、記録上「いつから、どんな作品に取り組んでいる」ことになっているかがわかる。

問い合わせの作業は例によって、ぼちぼちと進めていくことになるだろう。
対象となる作品を抱えておられる方は、できれば不躾なメールが届く前に、あらためてどうするか考えて、続けるか、手放すか、reception@aozora.gr.jp 宛にご連絡いただけるとありがたい。

継続の意思をもっている人を、行き違いで、担当から外してしまうケースが出てくるのではないかと怖れている。
気付いたときはどうか、怒りを抑えて、継続を申し入れて欲しい。

悩むこと。腹の立つこと。いろいろと生じると思う。
でも、この「目覚ましプロジェクト」によって、宙ぶらりんになっている作品の公開は、きっと早くなる。
たずねる側、たずねられる側と、今回は異なった立場となるが、ともに青空を仰ぐ仲間同士。
心と力を寄せ合って、この試みも進めていければと願っている。(倫)

2003年10月10日 「作品集」ファイルを分解
「むしとりあみ」で直すと決めたものの修正が、行司さんと、協力を申し入れてくれた皆さんの手で、進められてきた。
その過程で、気になっていた要素を、この際片付けてしまおう、ということになった。
「作品集」としてまとめてきたファイルの、分割だ。

青空文庫の公開用ファイルには、複数の作品を一まとめにしたものがある。
寺田寅彦の「あひると猿」「球根」「子猫」など、自然と生物にテーマをとった随筆、13作品は、「寺田寅彦随筆集第一巻」と名付けた一つのファイルにおさめられている。
夢野久作の「悪魔祈祷書」「あやかしの鼓」「瓶詰地獄」「死後の恋」は、「「瓶詰地獄」他」としたファイルに入れてある。
文庫が始まって間もない時期に登録した作品に、この形のものが多い。

作品を選んで、適当なまとまりがつくれれば、読書の手助けになる。
ただ、青空文庫をデータベースによる管理に移した段階で、「作品集」ファイルのマイナス面が浮かび上がってきた。
たとえば寺田の「あひると猿」に誤りが見付かった際は、データベースの仕組みの都合で、「寺田寅彦随筆集第一巻」の全作品に対して13回、修正したファイルを関連づけなければならなくなった。
「あひると猿」はそれほど長いものではないが、あとの12作品がおまけに付いてくると、サイズもます。
現在のサーバーの契約では、容量が膨らむと使用料が高くなるので、経費節減の意味からも、見逃しにはしたくない。

そんな事情があって、ファイル修正プロジェクトの世話役を中心に、「作品集」にまとめられたファイルの扱いを協議した。
その結果、かなりの作業量にはなるのだが、今回思い切って、分割してしまおうということになった。
古いものの多いまとめファイルでは、しばしば、注記形式が現在の方針に適合していない。
どうせつくり直すのなら、注記の形式合わせも行おうと決めた。

初期に登録した作品では、多くの場合、「テキストファイル(ルビあり) 」「テキストファイル(ルビなし) 」「HTMLファイル」「エキスパンドブックファイル」の4種類が登録されている。
今回の分割・修正作業を経た後は、現行の注記に対応した「テキストファイル(ルビあり) 」と、これから自動生成した「XHTMLファイル」、加えてこれまで通りの複数作品をひとまとめにしたエキスパンドブックを、容量を食わない置き方を工夫して、引き落とせるようにしようと考えている。

底本にあるルビをわざわざ取り除いた、「テキストファイル(ルビなし) 」は、分割・修正をおこなった作品に関しては、置かないことにする。
正規表現に対応したエディターを使えば、鈴木厚司さんによる「ルビなしテキストの作り方」に示された方法で、簡単にルビを削除できる。必要な方は、この方法をとってくださるよう、お願いしたい。

作品集形式のエキスパンドブックの流用は、分割に手が回らないためだ。
「むしとりあみ」で直すと決めたものの修正対象からも、エキスパンドブックは外している。
この点も、ご容赦いただきたい。

分割・修正したファイルの差し替えは、来週早々から始める。
何を分割し、どんな修正を施したかは、おそらく週末ごとに、「訂正箇所一覧 2003年分」に書き込んでいくことになると思う。

加えてサーバーの容量削減を目指し、もう一つ、やりたいことがある。
2002年5月7日から6月14日にかけて登録した作品では、圧縮したものとしていないものの、2種類のテキスト版を用意した。
この内の非圧縮テキストを、この告知から1週間後をめどとして、廃止したい。

青空文庫の公開ファイルは、原則として、作品ごとのテキスト版とXHTML版。
手間をかけて過去に作ったエキスパンドブックや.bookを捨てることはしたくないが、この方針に基づいて、過去に公開したテキスト版とHTML版については、時間をかけて整理していくことになると思う。
ファイルの品揃えに関しては、後退だろう。
だが、文庫側は、長い寿命の期待できるファイルのみを、シンプルな形で提供するのがやはり、賢明ではないだろうか。
「読みやすさ」や「まとまりとしての意味」という、これも大切な要素は、文庫のファイルを二次加工してくれる人たちや、テキストブラウザーなどの働きに委ねたい。

実は、文庫のXHTML版をそのまま、エキスパンドブック並みの読みやすさ、表現力で表示できるよう、テキストブラウザー側に対して、働きかけを行っている。
その成果を、そらもようでお知らせできる日を、心待ちにしている。(倫)

2003年10月02日 携帯版電子書店パピレス
昨日から、電子書店パピレスの広告がトップページに加わった。
電子書店パピレスが生まれたのは、1995年11月というから、青空文庫の2年ほど前になる。パソコン通信からスタートし、その後すぐに、インターネットに基盤を移した。現在では、214社の1万4000をこえる作品を取り扱っているという。
その電子書店パピレスが、本日から携帯電話向けの専門書店を開く。当初は KDDI の au 向けからサービスをはじめ、順次 J-PHONE などでも利用できるようにしていくという。
この携帯向けサービスで、表示をになうのが、「携帯書房」と名付けられたプログラムだ。去る9月まで、「携帯書房」を開発したライフメディアには、広告を出していただいた。青空文庫やプロジェクト杉田玄白のテキストを利用し、携帯電話読書サービスを提供してきた同社の技術が、本格的な携帯版電子書店の誕生を後押しすることになった。
携帯版電子書店パピレスは、さまざまなジャンルから3000作品をそろえてスタートする。そのうち、著作権の切れた1000作品については、通信費はかかるが、ファイルは無料という。
「携帯書房」の開発者に、「夏目漱石の「こころ」は、電話ではじめて読んだ」と聞かされて驚いた。ダメかもう、携帯ないと。(倫)

2003年09月27日 「青空文庫Q&A」ページ登場
青空文庫に関連することで、設立当初からやらなければ、やらなければ、と思っている細かいことがやたらたくさんある。そんなことは、青空文庫の中心にいたら、日々の仕事に追われてさっぱり出来ない。でも、中心から外れればフットワークも軽くなり、いろいろ対処できるようになってくる。

ということで、「aozora blog」をオープンしたことをきっかけに、それにリンクして「青空文庫Q&A」ページをつくりました。毎回「みずたまり」などに寄せられる、青空文庫ユーザーの純粋な質問などをまとめる予定です。

「aozora blog」は青空文庫のトップページにある「別館」から、「青空文庫Q&A」は「資料室」からリンクされてます。たまには覗いてみてください。(ag)

2003年09月24日 「忘れえぬ人々」入力ご担当へのお願い
国木田独歩「忘れえぬ人々」の入力をご担当いただいている方に、ご連絡を乞います。
ある方から、「忘れえぬ人々」の入力を引き継げないか、打診されました。
進行状況とお気持ちの確認のため、メールをお送りましたが、不達でした。
reception@aozora.gr.jp宛に、ご一報をお願いします。

本日から一ヶ月、ご連絡を待ちます。
一月を経て、連絡を取り合えない場合は、今回申し入れてくださった方に、引き継いでいただこうと考えています。(倫)

2003年09月17日 加藤文太郎「単独行」の入力者を変更
加藤文太郎「単独行」の入力者を、変更します。
2000年11月からご担当いただいてきた方に、8月14日、ここ「そらもよう」で世話役へのご連絡をお願いしました。
以来、一ヶ月のあいだに四度、「みずたまり」で同じ趣旨の呼びかけを行いましたが、連絡を取り合えませんでした。
そこで、事前に想定して告知した方針に従い、作業の引き継ぎを申し出てくださった新しい方に、あらためてお願いしなおすこととした次第です。

繰り返しになりますが、入力、校正をご担当いただいている、すべての皆さんにお願いします。
アドレスは、ここ青空文庫においてはしばしば、私たちをつなぐ唯一の絆です。
変更の際は、reception@aozora.gr.jp宛に、必ずご一報ください。(倫)

2003年09月07日 「最新公開作品」に「副題」まで表示
新しく公開した作品をトップページで紹介する際、著者名と作品名に加えて、副題も示すことにした。
作品名を一つにそろえ、各まとまりの名前を副題として採ってきた、「大菩薩峠」や「半七捕物帳」のようなケースでの、わかりやすさを狙った措置だ。

明日公開する泉鏡花「錦染滝白糸」には、「――其一幕――」が副題に設定されており、ここまで表示される予定。
今後、連続して公開していく「源氏物語」「中国怪奇小説集」などのシリーズもので、今回の対処が生きてくると思う。(倫)

2003年08月14日 「単独行」入力ご担当へのお願い
加藤文太郎「単独行」の入力をご担当いただいている方に、ご連絡を乞います。

ある方から、「単独行」の作業を引き継げないかと打診がありました。
進行状況とお気持ちの確認のため、メールをお送りましたが、不達でした。
世話役には他に、連絡の手がかりがありません。
reception@aozora.gr.jp宛に、ご一報くださいますよう、お願いいたします。

本日から一ヶ月、ご連絡を待とうと思います。
その間、掲示板の「みずたまり」にも何度か、同様のメッセージを掲載します。
一ヶ月を過ぎて、連絡を取り合えない場合は、今回申し入れてくださった方に、引き継いでいただこうと考えています。

入力、校正をご担当いただいている、すべての皆さんにお願いします。
アドレスは、私たちをつなぐ絆。
変更の際は、reception@aozora.gr.jp宛にご一報ください。(倫)

2003年08月01日 「作業着手連絡システム」による受付開始
昨年暮れの予告から、ずいぶんお待たせしてしまったが、入力と校正の受付をおこなう「作業着手連絡システム」を、本日から一般公開することになった。長きにわたって少しずつすすめてきた青空文庫IT化事業も、これで一段落をむかえる。
データベースを基盤としたシステムに移行する前は、「入力中の作品」の更新は、全て手作業でおこなっていた。メールで着手連絡を受け、受付担当者が返事をし、一週間分程度をまとめて更新担当者にメールで伝え、更新担当者が一覧表を更新する。タイムラグは避けられず、タイミングによっては、一覧への反映がかなり遅くなることもある。また、全てが人間のやることなので、途中過程で連絡ミスや更新もれが発生する危険性も高かった。
データベースシステムによる運用を開始してからは、データベースに登録された情報から「作業中の作品」を自動的に更新できるようになった。しかし、メールで受けた連絡をデータベースに転記する工程は、手作業のまま。連絡ミスや更新もれはなくなったけれど、底本の書誌情報を再確認するといった「手戻り」は、いくらか発生していた。
新しいシステムは、作品名や底本などの情報を、作業する人がウェブ上のフォームに記入して、送信するしくみになっている。フォームには、データベースへの登録に必要な項目が示され、記入例も掲載されているので、情報が不足したり、書き方に迷ったりすることも少なくなるだろう。申請の重複をできる限り避けるため、校正受付システムでは、「校正待ち」の作品のみをピックアップして一覧表示し、どの作品が作業可能か、ひと目で分かるように工夫した。連絡を受けた側は、記入された項目をチェックし、問題なければそのままデータベースに反映する。手作業が最小限になることで、手戻りの発生も少なくなると期待している。

「作業着手連絡システム」の入り口は、「工作員を志願される皆さんへ」および「工作員マニュアル」のHTML版に示した。「作業に参加してみよう」と思われる方は、まずは、これらの文書を参照し、とりかかる作業の内容を連絡して欲しい。作業全体の流れや細かいルールなどを、この機会に少し見直しているので、これまでに作業経験のある皆さんも、入り口をたどるついでに、もういちど「工作員マニュアル」に目を通していただき、現状を把握していただければありがたい。
ちなみに、「工作員マニュアル」には、まだ反映できていないことがらがたくさんある。IT化が一段落したあとは、最新情報のマニュアルへの反映という、なんともアナログな作業が待ちかまえている。こちらも、これから時間をかけて取り組んでいくことになるだろう。
また、これまでの info@aozora.gr.jp に加え、入力や校正にかかわる連絡用アドレスとして、 reception@aozora.gr.jp の運用を開始する。メールアドレスの使い分けも、どうぞよろしく。
できる限り使いやすく、シンプルにと心がけたつもりではあるけれど、新しいシステムというものは、「これまでに見たことのないものを使う」ことを余儀なくさせる。青空文庫の作業にたずさわった経験のある人にとっては、これまでのメールによる連絡に比べて、少しばかり面倒に感じられるかもしれない。慣れるまでは、ご不便をおかけすることになるけれど、ぜひとも気長におつきあいいただけますように。(LC)

2003年07月07日 aozora blog スタート
青空文庫の専従業務から離れてはや一年近く。なんとなく青空文庫に関して何か新しいことをやりたいなあ、と思ってあたりを見回してみると、blogなるものが幅を利かしている。blogなんて、結局何だかよく分からない代物だが、ちょっぴり面白そうなので、それを使ってみようと思い立つ。でも、一人では辛いので、いろいろと御世話になっている工作員のみなさんを巻き込んでしまいました。それがこの「aozora blog」です。おそらく、将来的には、青空文庫をblog化するなんて話しもあるのかもしれないけれど、それはまた別のお話し。まずはこの「aozora blog」でblogを勉強させていただいて、blogとはどんなもんだか見極めさせてください。とりあえずは深く静かに潜行します。

aozora blog →→ http://www.siesta.co.jp/aozora/

なお、このサイトを立ち上げるにあたって、シエスタ・ウェアのバスケさんに協力していただきました。(ag)

2003年05月06日 ファイル修正ボランティアの募集案内
5月5日付けのそらもようでお知らせしましたように「むしとりあみ」に寄せられた修正点の修正を始めます。修正するべきファイル、修正点が膨大なものとなっておりますので、皆様に御協力をお願いしたいと思います。

修正するべきファイルは、テキストファイルとHTMLファイルです。二つのファイルについて、修正点一覧にあります修正点を修正していただける方は、以下のメールアドレスに連絡をお願いいたします。連絡には、お名前(ハンドル名可)と修正希望の作品名と著者名を含めて下さい。

revision@ecis.nagoya-u.ac.jp

希望の連絡をいただいた方には、行司より修正マニュアルを含む細かな連絡をいたします。また修正後のファイルも同様に上記の修正用のメールアドレスに送っていただけますようお願いいたします。修正していただいたファイルは、ある程度の数がたまったら、定期的にデータベースへとアップし、青空文庫本体に登録してゆきます。皆様の御協力を感謝いたします。(「むしとりあみ」行司一同)

2003年05月05日 「むしとりあみ」ファイル修正作業に着手
2002年2月に「むしとりあみ」を開設して1年以上が経過しました。その間、皆様のご協力を得て多くの修正項目をご指摘いただきましたが、諸般の事情により修正作業に取り組むことができませんでした。そこで、先日「青空文庫」オフ会の折に話し合いをし、以下の手順でファイル修正作業を進めることに決定いたしましたので、ご報告申し上げます。


(1)ファイルの修正は、テキストファイル(ルビありとルビなしがある場合は両方)とHTMLファイルのみとする。修正は、原則として「むしとりあみ」によって発見された誤植の範囲のみとする。(エキスパンドブックの修正とテキストファイルのXHTMLファイル化可能な注記への修正については今後の検討課題として残します。)

(2)ファイル修正作業は広くボランティアを募る。(修正箇所一覧を別途用意し、進行状況も確認できるようにします。)

(3)ファイル修正期間中は「むしとりあみ」を一時閉鎖する。(閉鎖は2003年5月6日を予定しています。閉鎖期間は作業の進行具合によります。)

(4)「むしとりあみ」閉鎖中も、過去ログが閲覧できるようにする。(書き込みはできません。)

以上です。なお、ファイル修正ご協力お申し出の連絡方法やファイルの送付先につきましては、あらためて「そらもよう」等で告知いたします。(「むしとりあみ」行司一同)

2003年05月01日 「ケ」と見える文字の入力方針を確定
底本上で、片仮名の「ケ」のように見える文字には、二種類あると気付いた。
あらためて確認してみると、青空文庫が入力の基盤としている JIS X 0208 という文字コードは、この二つを区別して扱うよう求めていた。
こうした事情がつかめていなかったために、これまでのファイルの多くで、誤った処理を行っていた。

なぜ、どこを間違えたのか、青空文庫メーリングリストで確認し、本当はどう対処すべきかを話し合った。
「これからは、こうしよう」と、多くの仲間が合意できる方針がまとまったので、本日から適用する。
底本上で片仮名の「ケ」のように見える文字には、少し小さくつくったものと、並みの大きさのものがある。
これらを入力する際には、文字の大小は、どう扱うかを決める手がかりとはしない。
文章の流れを追って、どう読むかで、どう入れるかを決める。

流れから、「け」と読むことが明らかな片仮名は、区点番号5-17の片仮名の「ケ」で入力する。(これは、当たり前。)

一方、「こ」「か」「が」と読むと思われるものは、区点番号5-86の「ヶ」で入力する。(「こ」と読む、「一ヶ」。「か」と読む、「二ヶ所」「六ヶしい」。「が」と読む、「霞ヶ関」「槍ヶ岳」などが、これに該当する。)
なぜ、このように対処するかの理由と、作業方針の詳細を、「区点番号5-17と5-86の使い分け指針」にまとめた。
入力、校正にあたって、今日からは、この方針で進めてほしい。

本日付けで登録した、泉鏡花「栃の実」には、問題の字が出てくる。
「日野ヶ峰」と「柳ヶ瀬」の「ヶ」だ。これは、流れから「が」と読むことが明らかなので、区点番号5-86の「ヶ」で入れた。
底本はこの字を、並みの大きさでつくっている。
こうしたケースに対する、「指針」の求めに応じて、ファイル末に、「※底本は、物を数える際や地名などに用いる「ヶ」(区点番号5-86)を、大振りにつくっています。」と注記した。

このそらもようだけでは、戸惑いが残るかも知れない。「指針」の一読と、確定した作業方針の遵守をお願いしたい。(倫)

2003年04月23日 不適切と思われる表現への対処方針を変更
入力する作品に、「今日の人権意識と言語感覚に照らして不適切と思われる表現」があった際の対処方針を、4月21日付けで変更した。

これまでは、作品ファイルの末尾に以下のように入れてきた。
「※本作品中には、身体的・精神的資質、職業、地域、階層、民族などに関する不適切な表現が見られます。しかし、作品の時代背景と価値、加えて、作者の抱えた限界を読者自身が認識することの意義を考慮し、底本のままとしました。(青空文庫)」

これからは、作品ファイルにはこうした注記を入れず、図書カードの作品データ、備考欄に、次のように書くことにする。
「この作品には、今日からみれば、不適切と受け取られる可能性のある表現がみられます。その旨をここに記載した上で、そのままの形で作品を公開します。(青空文庫)」
同じ備考欄に、別の文言を記載してきたケースがあったが、今後は、上記の形に統一する。

【変更する理由】

自分自身の言語感覚に照らして、不適切と思われる表現があったら、ファイルを作成し、公開する者として、当該の言葉と、言葉の根にある感覚、考え方に、態度を表明するべきではないか。
加えて、「この作品にはそうした表現が含まれている」と、読む人に伝えることも、必要なのではないか。
従来の注記は、そう考えて、作品ファイルに組み込むことに決めた。
だが、運用してみると、注記文言の「踏み込み」が、繰り返しとまどいを生じさせた。

入力や校正に取り組む動機の一つは、作品への共感だ。
その作品の中に、対象となりそうな言葉があったとしても、それで「作者の抱えた限界」などとレッテルを貼ってよいものか、強いためらいを覚える仲間がいた。
いくつかの作品を巡って、注記を入れるか否かの論議が、繰り返された。文言の妥当性も、青空文庫メーリングリストなどで検討された。

そんな流れの中で、「光の君再興プロジェクト」において、作者が「唐土」の訳語として選んだ「支那」が問われた。
何度目かの辛いやりとりを重ねる中で、注記文言を、「態度表明」と「警告」に的を絞った、必要最小限のものに切り替えようという提案が生まれた。

青空文庫で作成したファイルは、広く、長く、使い回される可能性がある。
ならば、ファイル自体に文言をくくりつけることはせず、注記するか否かの線引きも、それぞれの公開主体に任せた方が良いのではないかという考えが示された。

新しい対処方針をメーリングリストにはかり、プロジェクトからの作品公開スタートに合わせて、切り替えることとした。

【注記の手順】

青空文庫の図書カードに注記する主体は、文庫におけるファイルのインターネット公開に責任を負う、世話役とする。
入力者、校正者、ファイル点検者などから提案があった際、世話役は注記の妥当性を検討し、提案者と話し合った上で、実行するか否かを決める。

作業途中で引っかかりを覚えたら、ファイルのやりとりの際にでも、指摘してほしい。

【関連文書の変更】

今回の方針変更に伴って、「旧字、旧仮名で書かれた作品を、現代表記にあらためる際の作業指針」の15項、16項をあらためた。
「青空文庫収録ファイルへの記載事項」からは、従来の注記文言に関する記述を削除した。


これが果たして「前進」なのか、私にはわからない。
ただ、「不適切と思われる表現」をめぐって延々と腹這いのやりとりを続け、のばした指の先でかろうじてとらえたのが、今回の対処方針だったことは間違いがない。
しばらくはこれで、進めてみよう。(倫)

2003年04月22日 光の君再興プロジェクトの新機軸
光の君再興プロジェクトから、昨日に引き続き、「空蝉」「夕顔」を公開する。初回分は、ここまでの四作品である。以降は、まとまって数点の公開が可能となった時点で、公開を予定している。

光の君再興プロジェクトでは、プロジェクト形式で校正を行っているだけではなく、公開までの作業においても従来の形式と変わっている点がある。その点に関して、公開にいたるまでの過程の現状を含めて、「ファイル確認作業を担うグループ」である点検部屋を代表して小林、門田が、少し記しておきたい。

従来は、入力、校正以外の作業は世話役の方々に一任してきた。現在では、これらの作業が少しずつ世話役の方々以外に開かれてきている。その現状を記すことで、光の君再興プロジェクトで採用した新機軸も理解していただけると思う。まず、入力が終了したファイルは、校正をお願いする前に必ずそのファイル形式の点検を行っている。また、校了となったファイルに関しても形式点検を行うことがある。これらの形式点検は、青空文庫の採用した自動生成という方式にファイルを適合させるために必須な作業である。しかし、自動生成に適応させるための形式点検には、いろいろと細かい注意が必要とされるため、その全てをマニュアルに記載し、その作業を入力、校正を引き受けてくれる方々にお願いするのは難しいことであった。よってこれまでは、世話役の方々がこの作業を全て行って、その上で公開用のファイルを作成していた。現在では、世話役の方々以外の人員(点検部屋のメンバー)も、校正前、校了後のファイルの点検を行っている。

光の君再興プロジェクトでは、校正をお願いする前のファイル点検から校正を担当していただける方々にお願いしている。また、校了ファイルの点検は、すべて点検部屋のメンバーである小林、門田が行っている。そして、全く新たな試みとして、公開用ファイルの作成を点検部屋のメンバーが担当している。これらの新機軸は、従来ブラックボックスとなっていたファイル公開までの道のりを開かれた形にするテストケースとして考えられている。

青空文庫の目指す「開かれた青空文庫」の最大の目的は、世話役の方々の負担を広く分散させてゆくことであり、しなやかな体制を作ってゆくことである。入力、校正以外のファイル点検、公開用ファイルの作成といった実作業を多くの人が分担し、そのノウハウを理解することが、「開かれた青空文庫」そして「しなやかな連携」へとつながってゆくことを信じて、この方向に流れを向けているというのが現状である。

以上のように述べてきたファイル点検、公開ファイルの作成というある意味で裏方の実作業は、まだまだ多くの人手を必要としており、「開かれた青空文庫」のためにもさらに多くの人にそのノウハウを伝えていきたいと考えている。こういったノウハウに興味のある方、青空文庫ファイル作成の最先端を覗いてみたい方は、点検部屋に参加してみませんか。(小林繁雄、門田裕志)

2003年04月21日 「光の君再興プロジェクト」初回公開作品
2003年2月15日にスタートした「光の君再興プロジェクト」について、本日「桐壺」「帚木」の2作品を公開することができた。

同プロジェクトは現在、12名の参加者で進行している。グループウェアという共同作業場を介しての共同作業、校正者に形式整備点検作業もお願いする等の新しい試みが行われた。また不適切表現に関する注記の新しい方法がプロジェクト内での議論から生まれ、青空文庫メーリングリストに提案することができた。今回の公開作品はこの注記方法によっている。
今回青空文庫の「世話役」でない私が、プロジェクトのきっかけを作ることができたのも世話役T氏の巧みな導きとプロジェクトに賛同し校正者として参加していただいた方々ご協力のおかげである、青空文庫の活動はインターネットと同様に「ベストエフォート型」であればいいと思っている。
まだ「源氏物語」54帖のうち2帖を公開できただけであるが、個人で作業するよりは遥るかに早いスピードで進行している。各作品校了後、順次公開していく予定である。入力作業を省略できたのも「古典総合研究所」で入力したテキストの再利用を認めていただいたおかげである、改めて感謝の意を表したい。校正者についても希望される方がいればinfo@aozora.gr.jpあてに申し込んでいただきたい。(kom)

2003年04月20日 「新JIS漢字総合索引」と「Kandata」に新版
「新JIS漢字総合索引」を、調整した。フォントの誤りに引きずられて、間違った字体を表示しないための措置だ。
「明日の硯箱」に、最新版が置いてある。すでに利用している方は、差し替えてほしい。
第3第4水準の漢字を使いたいなら、「索引」はきっと役に立つ。これまで利用してこなかった人も、これを機会に、是非試してみてほしい。使い方の詳細は、こちらで。(ただし、利用に先だって組み込む必要のある JIS X 0213 対応フォントは、Windows であれば、95、98、Me まで。Macintosh では、OS 9 まででしか利用できない。そのため、WindowsNT、2000、XP、Macintosh OS X など比較的新しい環境で、「索引」を使えないでいる。)
どこをいじったかは、「明日の硯箱」のページの下を参照。

「新JIS漢字総合索引」に欠かせないフォント「Kandata」も、タイミング良く更新された。
Windows の方は、「Kandata保管計画」から「Kandata4.tar.gz」をダウンロードして組み込んでほしい。
Macintosh の方は、「Macintosh 用 JIS X 0213 フリーフォントのページ」から「Kandata」を。
面区点番号2-8-68、2-80-38、2-82-7にあった字体の誤りが訂正されたほか、一部の字形が微調整されている。(倫)

2003年04月16日 植松眞人さんの新作を登録
植松眞人さんの「マギーさんのオムレツ。」「主よ、人の望みの喜びよ」「自動車の名前。」を登録する。
「マギーさんのオムレツ。」は、「神さんが降りてきた。」シリーズの三作目。青空文庫に関わったからこそ出会えた作家、作品がいくつかあるが、「神さん」の物語も私にとってはその一つだ。見知らぬ同士が、力を寄せ合って進めている活動などにかかわっていると、神棚の奥か、人の心の底の方か、居場所に関しては定かに知らないが、この世を生きやすいものにと心を配る何かの存在を、確かに感じることになる。私にとっては、いろいろな意味で、待望の再会となった。
作者は、仕事として書いておられるわけではない。だが、読ませてもらった作品からはいつも、「プロの手並み」とでもいった、完成度を印象づけられてきた。アケミちゃんの落書きに救われる二人を描いた、最新作の「自動車の名前。」も、然り。
一方、「主よ、人の望みの喜びよ」では、強い緊張を味わった。繰り返し読んでみると、作者の「巧み」はここでもそここにちりばめられている。だが最初に読んだ時には、性を直視する視線の揺るぎのなさにただただ圧倒された。身を投じたのだと思う。作者はこの作品で。

登録済みの植松作品は、「作家別作品リスト」から。
先日、サーバーを変更されたので、作品ファイルのリンク先はすべて新しくなっている。
「リスト」「図書カード」上の標目としては、作者名、作品名を新字新仮名でとおしている。ご自身は「眞人」とされているのを、「真人」としているのはそれ故。(倫)

2003年03月11日 「高橋是清自伝」公開の遅れ
昨年8月16日に校了になった「高橋是清自伝」の公開が、事情により、さらに延びることになった。
ずいぶん先になるが、2029年1月1日まで、待っていただきたい。

この作品は、高橋是清の話を、秘書の上塚司が筆記してまとめたものだ。
1936(昭和11)年の二・二六事件で殺された高橋の著作権は、とうに切れている。一方、上塚司の没年は1978(昭和53)年で、権利はなお存続しているが、作品中に上塚署名で記載されている箇所を削除すれば、公開できるのではないかと、当初は考えた。
だが、高橋による「序」や、上塚による「手記者の言葉」からは、原稿作成における上塚の役割が、大変に大きかったと推測された。
そこで、上塚の著作権を継承しておられる方に、「上塚署名箇所を削除した上で、青空文庫で公開しようと考えている」旨ご報告し、それで上塚司の著作権を侵害することがないか、ご見解をおたずねした。

権利継承者からは、
1 高橋が話した内容を文章にまとめたのは、上塚であること、
2 中公文庫収録にあたって、上塚が旧表記を現代表記に改め、表現の一部を口語的に書き直したこと、
をもって、上塚司の著作権は「高橋是清自伝」全体に及んでいる、との見解が示された。

この認識を受けて、「高橋是清自伝」の公開は、上塚司の著作権が切れる2029年1月1日以降に行うことに決めた。

世話役の判断の誤りから、入力にあたられた kompass さんと、校正にあたられた松永正敏さんに、はなはだしい先行作業を強いる結果となった。
あらためてお詫び申し上げます。すみませんでした。(倫)

2003年03月06日 丹下左膳、参上
林不忘「丹下左膳 日光の巻」を登録する。
丹下左膳ものは初の登録となるが、今回の「日光の巻」、実は、シリーズ最終作だ。

著者の林不忘は、牧逸馬、谷譲次と三つのペン・ネームを使い分け、昭和初頭の10年間で大流行作家に上り詰めて突然、35歳の若さで逝った。青空文庫に関わることでもなければ、多分、読むことはなかっただろう。
「丹下左膳」にまつわるエピソードとして、隻眼隻腕のはずの左膳がついつい両手で突きをくれ、書き直すのが面倒なので、おっと右手はなかったで、そのまま書き抜けてしまったといった話を聞く。いいかげんといえばいい加減。だが、たたみ込むような歯切れの良い語り口からは、作者自身の面白がり加減や、上り調子の筆の勢いが活き活きと伝わってきて、時代の寵児となったのもむべなるかなと思わされる。
そして主人公。「大菩薩峠」の机竜之助にくらべれば、まだ多少、脳天気なところにすくいはあるが、左膳もなんとも虚無的、残忍で悪い悪い。こんなのが一作を生き延びて、ヒーローとしてシリーズを張るんだから面白い。

今回の「日光の巻」の底本は、山手書房新社刊の「林不忘傑作選5」。この1から4に、これに先立つ、「乾雲坤竜の巻」、「こけ猿の巻」が収録されている。両巻はいずれも、青空文庫未着手。これらを収録した新潮文庫版「丹下左膳」(一)〜(三)は確保済みなので、入力してくださるならお送りすることもできる。皆さん、よろしく御検討ください。(倫)

2003年03月04日 寺田寅彦随筆の公開再開
寺田寅彦の作家別作品リストに、作業中のものがずらりと並んでいる。
当初、この人のエッセーは、青空文庫版の「随筆集」に編もうと考え、第一巻「自然と生物」、第二巻「科学について」までは、まとめた形で公開した。
その後の巻の構成も決めていたのだが、一部の作品がそろわなかったために、校正を終わったものを、長く留め置いてきた。
この間に、当初の構成案に入っていなかったものの作業も進んだ。

寺田以外でも、初期には、複数の作品を青空文庫独自でまとめ、「作品集」などと名付けて公開したことがある。
だが、その後、短いものでも個別の作品として登録する形を、基本とした。
寺田に関しては、判断を遅らせてしまったが、これから個別に登録していこうと思う。
本日の「科学に志す人へ」「変った話」が、再出発の第一弾。
皆さん、たいへん長らくお待たせいたしました。(倫)

2003年02月16日 第4回デジタルアーカイブ・アウォードを受賞
青空文庫が、デジタルアーカイブ・アウォードを受けた。
京都デジタルアーカイブ研究センターによる賞で、今回が四度目。
過去には、アメリカ国立公文書館の「アメリカンメモリー」や、日本放送協会の「NHKアーカイブス」、The Internet Archive の「Wayback Machine」等が受賞していて、ちょっと面映ゆい。
去る1月29日、コンテンツフロンティア in 京都 2003 の一こまに組み込まれた受賞式に、顔を出してきた。

青空文庫では、2200 をこえる作品が公開されていて、著作権が切れたものであれば、有償無償を問わず、自由に再利用できるという。
実になかなか、けっこうだ。
ただ、試みに参加してみればすぐに分かるとおり、本当にけっこうで、また大変に難しくもあるのは、皆で自由に分かちあえる宝を積もうとする人の心を、一目一目編んでいくその過程、その積み重ねだ。
善意と正義は、力強くもあれば、また恐ろしくもある。
見も知らぬ仲間と言葉だけを頼りに、力を合わせて公の富を耕そうとする者が備えるべき資質の、それらは半分でしかない。
他の人の、異なった善意と異なった正義に向き合うことが、私たちの試みには不可欠だ。
いろいろなもめ事やいく度かの別れをこえて、青空文庫はここまできた。
新しい軋轢の種は、今もまかれている。
だが、小雪まじりの寒い寒い京都で思い起こしたのは、ほころびをふさぎ、亀裂を押しとどめようとした、仲間達の言葉と振るまいだ。
かじかむ手に、吐息を一つ。
まなざしを上げれば、道はなお、遠く見渡せる。(倫)

2003年02月15日 「光の君再興プロジェクト」スタート
みずたまりでの「源氏物語」をめぐるやりとりがきっかけとなって、あらためて「源氏物語」を校正し、「収録ファイルの取り扱い規準」に沿ったかたちで全54帖の公開を目指すプロジェクトがスタートした。名付けて「光の君再興プロジェクト」。スタートまでの経緯は、プロジェクト呼びかけ人となってくださったkompassさんのプロジェクトページで紹介されている。
光の君を再び世に送り出すには、何はともあれ、校正を担当してくれる人が必要だ。上記プロジェクトページの「校正者募集」を参照の上、手を貸していただければありがたい。光の君ファンの人も、かつて読破にチャレンジして挫折した人も、この機会に、ぜひご参加を。
古典総合研究所で公開されているテキストファイルを使わせていただくことができ、このプロジェクトを立ち上げるための道が、短期間でひらけた。この場を借りて、改めてお礼を申し上げます。(LC)

2003年01月12日 公開作品CSV
「作業中の作品」CSVファイルが好評なので、続いて「公開中の作品」一覧の開発をすすめていたが、このほど出来上がり、昨日から公開を始めた。CSVファイルへのリンクは、「総合インデックス」→「公開中」→「作家別」→「全てを表示」の冒頭にある。
「作業中」の一覧とあわせて利用すれば、その日の青空文庫の全てが一目でわかる。入力や校正を検討中の方はもちろん、二次利用を検討しておられる方など、利用の局面はいろいろありそうだ。これも、データベースならではの恩恵のひとつ。大いに活用して欲しい。(LC)

2003年01月01日 新しい年のスタート
あけましておめでとうございます。
2003年の青空文庫は、薄田泣菫「艸木虫魚」でスタート。ttzファイルも公開していますので、縦書きでお楽しみください。
恒例となった新規著作権切れ作品公開は、今年はお休みです。

新しい年も、青空文庫をどうぞよろしくお願いいたします。(LC)


1997年のそらもよう
1998年のそらもよう
1999年のそらもよう
2000年のそらもよう
2001年のそらもよう
2002年のそらもよう
トップページへ