青空文庫テキストへの「アクセント分解」の適用


「アクセント分解」とは、アクセント付きのラテン・アルファベットを、文字コードの制限がある日本語テキスト中で、記号などを用いて代替表記する手法です。この手法を用いれば、フランス語のアクサンやドイツ語のウムラウトなども書き表せます。

青空文庫では、収録テキストに「アクセント分解」の手法を採用しています。(参照:「注記一覧」>外字>アクセント符号付きのラテン・アルファベット

「アクセント分解」を適用した記法と適用外のアルファベット外字注記の一覧は、「青空文庫・外字注記辞書」にもまとめられていますが、ここにも参照の用のため、「アクセント分解」のみ掲げます。


アクセント付きラテン文字をアクセント分解(基本ラテン文字のみによる拡張ラテン文字 A の分解表記法)によって注記します。このアクセント分解で注記できるダイアクリティカルマークは以下のものです。(「」内がアクセント分解記号)

◎「’」アキュートアクセント(Acute Accent)
◎「‘」グレーブアクセント(Grave Accent)
◎「^」サーカムフレックスアクセント(Circumflex Accent)
◎「~」チルド(Tilde)
◎「:」ダイエレシス(Diaeresis)
◎「&」上リング(Ring Aboce)
◎「,」セディラ(Cedilla)
◎「/」ストローク(Stroke)
◎「_」マクロン(Macron)
◎合字

(凡例:左に本来の文字、右に「アクセント分解」による記述と、面区点番号ないしUnicode、文字の説明を示しています)

【a】

à    a`
1-9-54、グレーブアクセント付きA小文字
á    a'
1-9-55、アキュートアクセント付きA小文字
â    a^
1-9-56、サーカムフレックスアクセント付きA小文字
ã    a~
1-9-57、チルド付きA小文字
ä    a:
1-9-58、ダイエレシス付きA小文字
å    a&
1-9-59、上リング付きA小文字
ā    a_
1-9-90、マクロン付きA小文字

【c】

ç    c,
1-9-61、セディラ付きC小文字
ć    c'
1-10-43、アキュートアクセント付きC小文字
ĉ    c^
1-10-63、サーカムフレックスアクセント付きC小文字

【d】

đ    d/
1-10-48、ストローク付きD小文字

【e】

è    e`
1-9-62、グレーブアクセント付きE小文字
é    e'
1-9-63、アキュートアクセント付きE小文字
ê    e^
1-9-64、サーカムフレックスアクセント付きE小文字
ë    e:
1-9-65、ダイエレシス付きE小文字
ē    e_
1-9-93、マクロン付きE小文字
ẽ    e~
U+1EBD、チルド付きE小文字

【g】

ĝ    g^
1-10-64、サーカムフレックスアクセント付きG小文字

【h】

ĥ    h^
1-10-65、サーカムフレックスアクセント付きH小文字
ħ    h/
1-10-93、ストローク付きH小文字、無声咽頭摩擦音

【i】

ì    i`
1-9-66、グレーブアクセント付きI小文字
í    i'
1-9-67、アキュートアクセント付きI小文字
î    i^
1-9-68、サーカムフレックスアクセント付きI小文字
ï    i:
1-9-69、ダイエレシス付きI小文字
ī    i_
1-9-91、マクロン付きI小文字
ɨ    i/
1-11-12、ストローク付きI小文字、非円唇中舌狭母音
ĩ    i~
U+0129、チルド付きI小文字

【j】

ĵ    j^
1-10-66、サーカムフレックスアクセント付きJ小文字

【l】

ł    l/
1-10-14、ストローク付きL小文字
ĺ    l'
1-10-42、アキュートアクセント付きL小文字

【m】

ḿ    m'
1-8-83、アキュートアクセント付きM小文字

【n】

ǹ    n`
1-8-85、グレーブアクセント付きN小文字
ñ    n~
1-9-71、チルド付きN小文字
ń    n'
1-10-49、アキュートアクセント付きN小文字

【o】

ò    o`
1-9-72、グレーブアクセント付きO小文字
ó    o'
1-9-73、アキュートアクセント付きO小文字
ô    o^
1-9-74、サーカムフレックスアクセント付きO小文字
õ    o~
1-9-75、チルド付きO小文字
ö    o:
1-9-76、ダイエレシス付きO小文字
ø    o/
1-9-77、ストローク付きO小文字
ō    o_
1-9-94、マクロン付き O小文字

【r】

ŕ    r'
1-10-40、アキュートアクセント付きR小文字

【s】

ś    s'
1-10-16、アキュートアクセント付きS小文字
ş    s,
1-10-19、セディラ付き S小文字
ŝ    s^
1-10-67、サーカムフレックスアクセント付きS小文字

【t】

ţ    t,
1-10-55、セディラ付きT小文字

【u】

ù    u`
1-9-78、グレーブアクセント付きU小文字
ú    u'
1-9-79、アキュートアクセント付きU小文字
û    u^
1-9-80、サーカムフレックスアクセント付きU小文字
ü    u:
1-9-81、ダイエレシス付きU小文字
ū    u_
1-9-92、マクロン付きU小文字
ů    u&
1-10-53、上リング付きU小文字
ũ    u~
U+0169、チルド付きU小文字

【y】

ý    y'
1-9-82、アキュートアクセント付きY小文字
ÿ    y:
1-9-84、ダイエレシス付きY小文字

【z】

ź    z'
1-10-21、アキュートアクセント付きZ小文字

【A】

À    A`
1-9-23、グレーブアクセント付きA
Á    A'
1-9-24、アキュートアクセント付きA
    A^
1-9-25、サーカムフレックスアクセント付きA
à    A~
1-9-26、チルド付きA
Ä    A:
1-9-27、ダイエレシス付きA
Å    A&
1-9-28、上リング付きA
Ā    A_
1-9-85、マクロン付きA

【C】

Ç    C,
1-9-30、セディラ付きC
Ć    C'
1-10-28、アキュートアクセント付きC
Ĉ    C^
1-10-57、サーカムフレックスアクセント付きC

【D】

Đ    D/     ストローク付きD

【E】

È    E`
1-9-31、グレーブアクセント付きE
É    E'
1-9-32、アキュートアクセント付きE
Ê    E^
1-9-33、サーカムフレックスアクセント付きE
Ë    E:
1-9-34、ダイエレシス付きE
Ē    E_
1-9-88、マクロン付きE
Ẽ    E~
U+1EBC、チルド付きE

【G】

Ĝ    G^
1-10-58、サーカムフレックスアクセント付きG

【H】

Ĥ    H^
1-10-59、サーカムフレックスアクセント付きH

【I】

Ì    I`
1-9-35、グレーブアクセント付きI
Í    I'
1-9-36、アキュートアクセント付きI
Î    I^
1-9-37、サーカムフレックスアクセント付きI
Ï    I:
1-9-38、ダイエレシス付きI
Ī    I_
1-9-86、マクロン付きI
Ĩ    I~
U+0128、チルド付きI

【J】

Ĵ    J^
1-10-60、サーカムフレックスアクセント付きJ

【L】

Ł    L/
1-10-3、ストローク付きL
Ĺ    L'
1-10-27、アキュートアクセント付きL

【M】

Ḿ    M'
1-8-82、アキュートアクセント付きM

【N】

Ǹ    N`
1-8-84、グレーブアクセント付きN
Ñ    N~
1-9-40、チルド付きN
Ń    N'
1-10-33、アキュートアクセント付きN

【O】

Ò    O`
1-9-41、グレーブアクセント付きO
Ó    O'
1-9-42、アキュートアクセント付きO
Ô    O^
1-9-43、サーカムフレックスアクセント付きO
Õ    O~
1-9-44、チルド付きO
Ö    O:
1-9-45、ダイエレシス付きO
Ø    O/
1-9-46、ストローク付きO
Ō    O_
1-9-89、マクロン付きO

【R】

Ŕ    R'
1-10-25、アキュートアクセント付きR

【S】

Ś    S'
1-10-5、アキュートアクセント付きS
Ş    S,
1-10-7、セディラ付きS
Ŝ    S^
1-10-61、サーカムフレックスアクセント付きS

【T】

Ţ    T,
1-10-39、セディラ付きT

【U】

Ù    U`
1-9-47、グレーブアクセント付きU
Ú    U'
1-9-48、アキュートアクセント付きU
Û    U^
1-9-49、サーカムフレックスアクセント付きU
Ü    U:
1-9-50、ダイエレシス付きU
Ū    U_
1-9-87、マクロン付きU
Ů    U&
1-10-37、上リング付きU
Ũ    U~
U+0168、チルド付き U

【Y】

Ý    Y'
1-9-51、アキュートアクセント付きY

【Z】

Ź    Z'
1-10-9、アキュートアクセント付きZ

【合字】

ß    s&
1-9-53、エスツェット
æ    ae&
1-9-60、アッシュ、小文字AとEの合字
Æ    AE&
1-9-29、アッシュ、大文字AとEの合字AE
œ    oe&
1-11-10、リガチャOE小文字、円唇前舌広・中段母音
Π   OE&
1-11-11、リガチャOE大文字、円唇前舌広母音

【採用の経緯】

「アクセント分解」は、2000年、山本有二さんによって考案され、現在「アクセント付き文字の変換表」に集成されています。

そののち2001年6月、鈴木厚司さんが、九鬼周造『「いき」の構造』にこれを適用し、従来の青空文庫方式などとの差異を、「アクセント分解の表記例」にまとめてくださいました。(参照:2001年6月30日付「そらもよう」
従来方式と「アクセント分解」による『「いき」の構造』のテキストは共に、同作品の図書カードから引き落とすことができます。

この試みを元に生まれたのが、「アクセント分解」という記法です。


【一般的な日本語テキストにある制限】

青空文庫では、日本語の使えるパソコンやワープロが、ほぼ例外なく対応しているJIS漢字コード(第1第2水準の漢字を定めている、JIS X 0208)の枠の中で、ファイル作りを進めています。

こうしておけば、意図した文字が別の字に入れ替わったり、文字として表示されなかったりといった問題は生じません。
ただし、JIS漢字コードにないもの(外字)は、通常のテキスト中の文字としては取り扱えません。

そこで青空文庫では、外字に対しては、文字の成り立ちを示す注記を行ってきました。
漢字は、「※[#「※」は「牛+建」]といった形で示し、アクセント付きのアルファベットは、「desir[#desirのeにアクサン・テギュ(´)]などと書いてきました。


【より大きな文字コードによる解決】

その当時のJIS漢字コードよりも枠を広げた文字コードに、外字の多くが組み込まれ、それが情報機器に例外なく組み入れられるようになれば、もちろん状況は改善されるでしょう。
青空文庫は、より大きな文字コードに作業の基盤を移し、当時では外字として処理せざるをえないもののかなりを、今後は通常の文字として取り扱えるようになるはず、と考えていました。

第3第4水準の漢字を定めたJIS X 0213の文字集合は、アクセント付きアルファベットも広くカバーしています。
これが、新しい基盤として機能してほしいと、青空文庫では期待をかけつつ、一方で、次の土台がしっかり根付くまでには、まだ少し時間がかかるとも認識していました。
そのなかで、現状できる範囲内で解決を試みたのが、「アクセント分解」という手法でした。


【JIS漢字コードの枠内での工夫】

「アクセント分解」は、より大きな文字コードの定着を待つ代わりに、現在のJIS漢字コードの枠内で、アクセント付きのアルファベットを書き表そうとする工夫です。

山本有二さんによって考案され、「アクセント付き文字の変換表」にまとめられています。
青空文庫の作業にも力をふるってこられた山本さんは、作業者の協力の広場となっていた「青空文庫メーリングリスト」で、アクセント付きアルファベットの注記法が論議された際、この方式を紹介してくれました。

アクセントが頻出する、九鬼周造の『「いき」の構造』を入力された鈴木厚司さんと山本さんが中心となって、「アクセント分解」を青空文庫テキストに採用するための、細部の検討が行われました。
この作業を踏まえて、鈴木さんは『「いき」の構造』にこれを適用し、従来の青空文庫方式等と比較検討するために、「アクセント分解の表記例」を用意してくれました。


【「アクセント分解」の採用】

この成果を元に、2004年8月2日、「青空文庫テキストへの「アクセント分解」の適用」として、青空文庫全体としてアクセント付きアルファベットの表記問題にどう取り組むのか考えを進めていくための文書(本文書の前身)がまとめられました。

そして2010年4月1日公開の「注記一覧」に、記法のひとつとして取り上げられ、また2011年11月20日に更新された「青空文庫工作員マニュアル」の第二版で「アクセント分解」は正式採用されました。

多くの方々のご尽力に感謝いたします。




更新履歴:「青空文庫」
   2004(平成16)年8月2日作成
   2018(平成30)年7月7日修正
2018年7月7日作成
青空文庫作成ファイル:
このファイルは、インターネットの図書館、青空文庫(https://www.aozora.gr.jp/)で作られました。制作にあたったのは、ボランティアの皆さんです。



戻る