青空文庫における書誌データのとりかた

2004年10月5日 作成
2011年4月22日 最終修正

データベースに記録し、青空文庫「総合インデックス」の各種リストや図書カードに表示させる書誌データは、以下の方針に従ってとる。



【人物名】

・作家名、翻訳者名等として表示される「人物名」のデータは、以下の優先順位に従ってとる。

 1 参考資料などで多く用いられている形。
 2 多くの著作で一致している形。
 3 底本に表示されている形。
※作品ファイルの冒頭に記載する著者名、翻訳者名等は、「青空文庫収録ファイルへの記載事項」に従って、底本に表示された形でとる。よってファイル冒頭の人物名は、書誌データとして採取されて「総合インデックス」に表示されるものや、他の作品ファイルの冒頭に記載されるものとは異なる場合がある。
・「人物名」の表記に際して、新旧の関係にある漢字を用いる際は、新字を選ぶ。
※2004年9月27日の戸籍法施行規則改正によって、人名用漢字由来の新旧関係には、判断に迷う点が出てきた。(「人名用漢字 2004年9月27日改正から生じる疑問」参照)青空文庫では当面、改正以前の規準に従って、新旧の判定を行うこととする。人名用漢字由来のものに関しては、以下のペアの右を左で置き換える。
亘亙/尭堯/巌巖/弥彌/晋晉/曽曾/槙槇/瑶瑤/禄祿/穣穰/聡聰/艶艷/遥遙/亀龜
・旧字表記が一般的なものは、新字に加えて、旧字でも「人物登録」を行う。
「芥川竜之介」に加えて、「芥川龍之介」も登録する。
「与謝野晶子」に加えて、「與謝野晶子」も登録する。
・旧字表記による作家名には、新字によるものを、「人物基本名」として設定する。
・「人物基本名」の設定により、「登録全作家 作家リスト」に見るとおり、「子」となる旧字側から「親」となる新字側に送りがかかる。
・新旧関係によって生じた「親」「子」関係では、「親」側にすべての作品を寄せる。

・複数の名前を使い分けた人物では、「人物基本名」の設定により、もっとも広く知られていると思われる名を「親」、それ以外を「子」として登録し、「子」から「親」に送りをかける。
「林不忘」を「親」、「牧逸馬」「谷譲次」を「子」として登録する。
・「人物名」と「作品名」の対応付けは、底本、底本の解説、初出、初版などを参考にして判断する。
林不忘に「丹下左膳」を、牧逸馬に「浴槽の花嫁」を、谷譲次に「踊る地平線」を対応させる。
・本人による意図的な使い分けは行われていないものの、複数の名がみられる人物では、「人物基本名」の設定により、もっとも広く知られていると思われる名を「親」、それ以外を「子」として登録し、「子」から「親」に送りをかける。
「泉鏡花」を「親」、「泉鏡太郎」を「子」として登録する。
・本人による意図的な使い分けによらない「親」「子」関係では、「親」側にすべての作品を寄せる。

【人物名読み】

・漢字による日本人、中国人、朝鮮人人物名の「読み」は、もっとも広く通用していると思われるものを、「青空文庫における「読み」の表記の規準」に従って、平仮名で書く。

・平仮名による「人物名」と、「人物名」のうち、平仮名で表記された部分の「読み」は、「青空文庫における「読み」の表記の規準」に従って、平仮名で書く。
・片仮名による「人物名」と、「人物名」のうち、片仮名で表記された部分の「読み」は、「青空文庫における「読み」の表記の規準」に従って、片仮名で書く。

【ローマ字表記】

・日本人人物名の「ローマ字表記」は、「青空文庫におけるローマ字のつづり方」に従って書く。

・中国人人物名の「ローマ字表記」は、ピンインで書く。(この方式を採用している「平凡社 大百科事典」に従う。)

・朝鮮人人物名の「ローマ字表記」は、ハングル読みをマッキューン・ライシャワー式で書く。(この方式を採用している「平凡社 大百科事典」に従う。)

・その他の外国人作家名原綴りのローマ字への翻字形は、「平凡社 大百科事典」による。

・アクセント符号は省略する。

【生年・没年】

・西暦により、「1900-01-01」の形で書く。

・明治6(1873)年1月1日の太陽暦施行以前の年月日も、太陽暦で記載する。

【作品名】

・底本の表記に従うが、新旧の関係にある漢字を用いる際は、新字を選ぶ。
「ヰタ・セクスアリス」の「作品名」は、「ヰタ・セクスアリス」と書く。
「あきまろに答ふ」の「作品名」は、「あきまろに答ふ」と書く。
「地獄變」の「作品名」は、「地獄変」と書く。
・くの字点の代用記号「/\」「/″\」は、使用する。
「雲のいろ/\」の「作品名」は、「雲のいろ/\」と書く。
・作品名の一部として組み込まれた空きには、原則として全角空きをあてる。(ただし1バイトのアルファベット中の空きには、半角空きを宛てる。「底本」「底本の親本」「初出」とも。)
「時 処 人」の「作品名」は、「時 処 人」と書く。
「通俗作家 荷風」の「作品名」は、「通俗作家 荷風」と書く。
「ウマヤノ ソバノ ナタネ」の「作品名」は、「ウマヤノ ソバノ ナタネ」と書く。

【作品名読み】

・「作品名」の「読み」は、もっとも広く通用していると思われるものを、「青空文庫における「読み」の表記の規準」に従い、以下の場合をのぞいて、平仮名で書く。

・片仮名による「作品名」と、「作品名」のうち、片仮名で表記されている部分の「読み」は、「青空文庫における「読み」の表記の規準」に従い、片仮名で書く。
「ラジオ雑感」の「読み」は、「ラジオざっかん」と書く。
・漢字で表記されている外来語(中国語、朝鮮語由来のものをのぞく。)の「読み」は、片仮名で書く。
「巴里より」の「読み」は、「パリより」と書く。
・アルファベットで表記されている外国語の「読み」は、その発音に従って、片仮名で書く。(「作品名」の語間の半角空きは、「読み」では全角空きとする。)
「HUMAN LOST」の「読み」は、「ヒューマン ロスト」と書く。
・アルファベットの「読み」は、「日本目録規則 標目付則1 片かな表記法」第3表に従って、片仮名で書く。
「M侯爵と写真師」の「読み」は、「エムこうしゃくとしゃしんし」と書く。
・ルビなどによって、「作品名」をどう読むか、底本が示している場合は、必要に応じて本項の規定にもとづく書き換えをおこなった上で、それを「読み」とする。
「難船小僧《S・O・S・BOY》」の「読み」は、「エス・オー・エス・ボーイ」と書く。
・「作品名」中の、記述記号、括弧記号、和字間隔は、「読み」にも残す。
「霊感!」の「読み」は、「れいかん!」と書く。
「「三人姉妹」のマーシャ」の「読み」は、「「さんにんしまい」のマーシャ」と書く。
「ああ華族様だよ と私は嘘を吐くのであった」の「読み」は、「ああかぞくさまだよ とわたしはうそをつくのであった」と書く。
・「読み」に関する特別な手がかりがない場合、「私」は「わたし」、「日本」は「にほん」と読む。
「装幀に就いての私の意見」の「読み」は、「そうていについてのわたしのいけん」と書く。
「日本の青春」の「読み」は、「にほんのせいしゅん」と書く。

【原題】

・「原題」は原則として、底本に表示されている形をとる。
・底本に記載がない場合は、参考資料などで多く用いられている形を「原題」としてとっても良い。
※底本に記載がない場合、作品ファイルの冒頭には「原題」を書き込まない。
・漢字による「原題」は、漢字で書く。
・漢字による「原題」が「作品名」と同じである場合、重ねて「原題」欄に書き込むことはしない。

・ローマ字(ラテン文字)、ギリシア文字、キリール文字による「原題」は、それぞれの大文字で書く。
・ラテン文字のアクセント符号は、省略する。

・その他のアルファベットによる「原題」は、ローマ字への翻字形で書く。