青空文庫で私たちがやろうとしていることは、テキストの〈交換〉だ。一台の孤立したマシンの画面上に、何万字もの漢字が表示できたり、プリントアウトできたとしても、そのファイルを不特定多数の人の手許で正しく表示できないのなら、少なくとも私たちが目指す〈交換〉の観点からすれば意味がない。 青空文庫は、依拠する漢字コードの包摂規準は、〈交換〉を一義とする以上、受け入れるしかないという前提に立っている。 包摂されるのか別字として取り扱われるのかを素早く判断することは不可能だ。 青空文庫と外字からの抜粋 |
「工作員作業マニュアル」の「「【微妙な字体差と包摂規準】」 」からの抜粋
遠雷のような汐鳴りの音と、窓を打つ※[#「金+肅」、第3水準1-93-39]々たる雨の音に、私がぼんやり目を覚ましたのは、十時頃だろうか、コロロホルムの酢の様な匂いが、まだ部屋中流れているようで、私はそっと窓を開けた。ウェブ上での表示
遠雷のような汐鳴りの音と、窓を打つ々たる雨の音に、私がぼんやり目を覚ましたのは、十時頃だろうか、コロロホルムの酢の様な匂いが、まだ部屋中流れているようで、私はそっと窓を開けた。
二日も飯を食えないジンジンする体を、三畳の部屋に横たえている事は、まるで古風なラッパのように埃っぽく悲しくなる。生※[#「さんずい+垂」、U+6DB6、235-7]が煙になって、みんな胃のふ[#「胃のふ」に傍点]へ逆もどりだ。ウェブ上での表示
二日も飯を食えないジンジンする体を、三畳の部屋に横たえている事は、まるで古風なラッパのように埃っぽく悲しくなる。生※[#「さんずい+垂」、U+6DB6、235-7]が煙になって、みんな胃のふへ逆もどりだ。]
面区点番号の付与は、マニュアルで要求されていない。そのために多くのファイルが、面区点番号を欠いている。だが、xhtmlファイルの自動生成を進めるためには、「第3水準1-93-39」にあたるところを書き込んでおくことが、必須となる。これにより外字画像をリンクさせている |
SJIS +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F 20 ! " # $ % & ' ( ) * + , - . / 30 0 1 2 3 4 5 6 7 8 9 : ; < = > ? 40 @ A B C D E F G H I J K L M N O 50 P Q R S T U V W X Y Z [ \ ] ^ _ 60 ` a b c d e f g h i j k l m n o 70 p q r s t u v w x y z { | } ~
シフトJIS +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F 8140 、。 , . ・ : ; ? ! ゛ ゜ ´ ` ¨ ^ 8150  ̄ _ ヽ ヾ ゝ ゞ 〃 仝 々 〆 〇 ー ― ‐ / \ 8160 〜 ‖ | … ‥ ‘ ’ “ ” ( ) 〔 〕 [ ] { 8170 } 〈 〉 《 》 「 」 『 』 【 】 + − ± × 8180 ÷ = ≠ < > ≦ ≧ ∞ ∴ ♂ ♀ ° ′ ″ ℃ ¥ 8190 $ ¢ £ % # & * @ § ☆ ★ ○ ● ◎ ◇ ◆ 81A0 □ ■ △ ▲ ▽ ▼ ※ 〒 → ← ↑ ↓ 〓 81B0 ∈ ∋ ⊆ ⊇ ⊂ ⊃ ∪ ∩ 81C0 ∧ ∨ ¬ ⇒ ⇔ ∀ ∃ 81D0 ∠ ⊥ ⌒ ∂ ∇ ≡ 81E0 ≒ ≪ ≫ √ ∽ ∝ ∵ ∫ ∬ 81F0 Å ‰ ♯ ♭ ♪ † ‡ ¶ ◯ 82E0 ゐ ゑ 8390 ヰ ヱ ヲ ン ヴ ヵ ヶ Α 83A0 Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ 83B0 Σ Τ Υ Φ Χ Ψ Ω α 83C0 β γ δ ε ζ η θ ι κ λ μ ν ξ ο π ρ 83D0 σ τ υ φ χ ψ ω 83E0 А Б В Г Д Е Ё Ж З И Й К Л М Н О 8440 П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю 8450 Я 8470 а б в г д е ё ж з и й к л м н 8480 о п р с т у ф х ц ч ш щ ъ ы ь э 8490 ю я ─ 84A0 │ ┌ ┐ ┘ └ ├ ┬ ┤ ┴ ┼ ━ ┃ ┏ ┓ ┛ ┗ 84B0 ┣ ┳ ┫ ┻ ╋ ┠ ┯ ┨ ┷ ┿ ┝ ┰ ┥ ┸ ╂
テキスト版の注記をどう書くかの外字に関する注記からの抜粋
例)
- 「亠」とし、「なべぶた」とはしない。
- 「儿」とし、「ひとあし」とはしない。
- 「冫」とし、「にすい」とはしない。
- 「匚」とし、「はこがまえ」とはしない。
- 「匸」とし、「かくしがまえ」とはしない。
- 「厂」とし、「がんだれ」とはしない。
- 「口」とし、「くちへん」とはしない。
- 「囗」とし、「くにがまえ」とはしない。
- 「廴」とし、「えんにょう」とはしない。
- 「彳」とし、「ぎょうにんべん」とはしない。
- 「豸」とし、「むじなへん」とはしない。
例)
- 「人がしら」とし、「人」とはしない。
- 「入がしら」とし、「入」とはしない。
- 「八がしら」とし、「八」とはしない。
- 「爪かんむり」とし、「爪」とはしない。
- 「竹かんむり」とし、「竹」とはしない。
- 「雨かんむり」とし、「雨」とはしない。
例)※検討課題。
- 「足へん」とし、「足」とはしない。(へんとして用いられる場合。)
- 「土へん」とし、「土」とはしない。(へんとして用いられる場合。)
- 「走にょう」とし、「走」とはしない。(にょうとして用いられる場合。)
- 「鬼にょう」とし、「鬼」とはしない。(にょうとして用いられる場合。)
- 「麦にょう」「麥にょう」とし、「麦」「麥」とはしない。(にょうとして用いられる場合。)
- 「風にょう」とし、「風」とはしない。(にょうとして用いられる場合。)
- 「瓜のにょうの形」とし、「瓜」とはしない。(にょうとして用いられる場合。)
「火/火へん」「立/立へん」「王/王へん」「金/金へん」「牛/牛へん」「馬/馬へん」などに関しては、「へん」なしとする
例)※検討課題
- 「ぼう」
- 「にんべん」
- 「りっとう」
- 「りっしんべん」
- 「てへん」
- 「さんずい」
- 「れんが」
- 「けものへん」
- 「やまいだれ」
- 「ぐうのあし」
- 「くさかんむり」
- 「ころもへん」
- 「一点しんにょう/二点しんにょう」
- 「おおざと」
- 「こざと」
「つりばり」は不採用でいきたい。形を想像できない人が多いと思われるので。
「しんにょう」は、次項9.に関連して、「一点しんにょう」「二点しんにょう」と書き分ける。
例)
- 「俊のつくり」
- 「捷のつくり」
- 「礼のつくり」(つりばりは不採用としたいので。)
- 「操のつくり」
- 「蚌のつくり」
例)
- 「馬+(米/(夕+ヰ))」の代わりに、「「馬+鄰のへん」と書く。
例)
- 「或」の「丿」に代えて「彡」
- 「恵」の「心」に代えて「日」
例)
- 「(臣+又)/金」の代わりに、「「堅」の「土」に代えて「金」」のほうがわかりやすい。
例)
- 「しんにょう+章」ではなく、「二点しんにょう+章」と書く。
- 「食+亶」ではなく、「飮のへん+亶」と書く。
- 「网がしら/(厂+(炎+りっとう))」ではなく、「罘」の「不」に代えて「厂+(炎+りっとう)」、と書く。
- 「木+習」ではなく、「木+褶のつくり」と書く。
- 「さんずい+畔」ではなく、「さんずい+田+絆のつくり」と書く。
- 「王+連」ではなく、「王+二点しんにょうの連」と書く。
- 「缶+尊」ではなく、「缶+墫のつくり」と書く。
- 「金+尚」ではなく、「金+淌のつくり」と書く。
- 「正+青」ではなく、「政のへん+睛のつくり」と書く。
- 「言+慧」ではなく、「言+(彗/心)」と書く。
- 「羽/廾」ではなく、「栩のつくり/廾」と書く。
例)
- 「魚+戸の旧字」
- 「木+勝の旧字」
- 「「姉」の正字」
- 「「柿」の正字」
- 「「怱」の正字」
例)
- 「Yに似た字」
Windows機種依存文字の外字注記作成方針から方針に当たるところを抜粋した。
記入例
「※[#「目+争」」、U+7741、ページ数-行数]」
「※[#「登+おおざと」、第3水準1-92-80]」
「※[#「厂+萬」、第3水準1-14-84]」
「※[#「二点しんにょう+官」、第3水準1-92-56]」
記入例
「※[#「くさかんむり/宛」、第3水準1-90-92]」
「※[#「白/十」、第3水準1-88-64]」
記入例
「※[#「菌−くさかんむり」、第4水準2-4-56]」
記入例
「※[#「水/(水+水)」、第3水準1-86-86]」
記入例
「※[#「勹<夕」、第3水準1-14-76]」
「※[#「門<虫」、第3水準1-93-49]」
記入例
「※[#「木+(「第−竹」の「コ」に代えて「丿」)、「柿」の正字」、第3水準1-85-57]」
「※[#「女+(「第−竹」の「コ」に代えて「丿」)、「姉」の正字」、U+59CA、ページ数-行数]」
テキスト版の注記をどう書くかの外字に関する注記からの抜粋
※[#二の字点、1-2-22]
※[#ます記号、1-2-23]
※[#コト、1-2-24]
※[#より、1-2-25]
※[#歌記号、1-3-28]
※[#濁点付き平仮名う、1-4-84]
※[#濁点付き片仮名ヰ、1-7-83]
※[#濁点付き片仮名ヱ、1-7-84]
※[#濁点付き片仮名ヲ、1-7-85]
※[#感嘆符二つ、1-8-75]
※[#疑問符二つ、1-8-76]
※[#疑問符感嘆符、1-8-77]
※[#感嘆符疑問符、1-8-78]
※[#ローマ数字1小文字、1-12-21]
※[#ローマ数字1、1-13-21]
※[#丸1、1-13-1]
※[#ファイナルシグマ、1-6-57]
テキスト版の注記をどう書くかの外字に関する注記からの抜粋
フランスには raffine[#eはアクサンテギュ(´)付き] という語がある。これに代えて、アクセント符号付きのラテン・アルファベットは、「アクセント分解」と呼ばれる手法を用いて表記します。#マニュアルの作業方針を変更するよう提案しています。
《例》 繁雑な日本の 〔e'tiquette〕 も、かな、漢字、記号(句読点と括弧をのぞく)とアルファベットの境は、マニュアルによって半角あけるよう定められています。
《例》 いささか、〔e'tranger〕 の感があった。
《例》 〔Son coeur est un luth suspendu;
Sito^t qu'on le touche il re'sonne.〕
「彼が心は懸《か》かれる琵琶《びわ》にして、
触るればたちまち鳴りひびく」
《例》 〔La pense'e doit remplir toute l'existence.〕
《例》 jusqu'〔a`〕
presqu'〔i^le〕
presqu'〔i^〕le
'Je me suis 〔blesse'e〕', dit-elle.
'bless〔e'〕e'
テキスト版の注記をどう書くかの外字に関する注記からの抜粋