青空文庫の作業状況 2019-2022
254

カテゴリー:青空文庫 | 投稿者:おかもと | 投稿日:2022年4月30日 |

はじめに

2018年10月に「青空文庫の作業状況」https://yozora.main.jp/inp/ を公開して、3年半たちました。公開した当初は、どれだけ利用されるのか不安でしたが、最近では一日に200名程度の利用者がいるようです。どうもありがとうございます。
この3年半の間にたまったデータをもとに、青空文庫の作業状況について振り返ってみたいと思います。

最初に、青空文庫で作品が公開されるまでの流れをおさらいしておきます。
まず、青空文庫の耕作員(工作員)が入力したい作品を申請して、入力予約か入力中、あるいは翻訳中の段階になります。
次に、作品の入力が終わったら、校正待ちの段階になります。このとき、青空文庫の中の人による点検が行なわれます。
今度は、入力した耕作員とは別の耕作員が校正を申請して、校正予約から校正中になります。
校正が終わったら校了で、公開を待つことになります。ここまでが作業中です。

作業中作品の内訳

こうした作業の流れを踏まえたうえで、次の表とグラフをごらんください。これは、2019年から2022年、いずれも1月1日の時点での作業中作品の件数を、作業状態別にわけたものです。

表1. 作業中作品の作業状態別内訳
2019 2020 2021 2022
入力予約 6 6 6 3
入力中 2,051 2,005 1,865 1,891
翻訳中 2 2 3 2
校正待ち(点検前) 1,396 1,209 1,101 798
校正待ち(点検済み) 902 1,336 1,501 1,826
校正予約(点検前) 24 24 39 40
校正予約(点検済み) 36 60 149 104
校正中 422 412 441 519
校了 713 662 459 361
公開予定 54 54 39 38
非公開 1 1 1 1
入力取り消し 668 666 667 669
6,275 6,437 6,271 6,252

これをみると、次のことがわかります。

  • 作業中作品の全体の件数は、2019年が6,275件、2022年が6,252件で、ほとんど変動していません。青空文庫は、毎日のように新たな作品を公開しているので、(ここには数字として出てきませんが)新たに入力が申請されて作業中になる作品の数と、公開により作業中ではなくなる作品の数が、ほぼ同じになっていることがわかります。
  • 入力中の件数をみると、2019年が2,051件、2022年が1,891件で、160件減っています。これは、新型コロナウイルスの影響で、青空文庫の新規作品受付が2020年4月に休止となり、同年7月には受付が制限付きで再開されましたが、現在まで制限付きの状態が続いていることが関係しているようです。
  • 校正待ちの件数をみると、校正待ち(点検前)の件数が減って、校正待ち(点検済み)の数が増えていることがわかります。これは、青空文庫の中の人が、点検をがんばった結果と思われます。
  • 校正予約(点検済み)の件数をみると、2019年の36件から2022年の104件と、68件増えています。また、校正中の件数も、2019年が422件、2022年が519件で、97件増えています。
  • 校了になった作品の件数は、2019年が713件、2022年が361件で、こちらは半分になっています。校正予約や校正中の件数が増え、校了の件数が減ったということは、全体として、校正の作業が滞っていることを示していると思われます。これも、新型コロナの影響かもしれません。

なお、青空文庫で新たに公開された作品の数は、2019年が614件、2020年が607件、2021年が508件で、ここにも新型コロナの影響が現われているようです。

作業中の作品数ベスト10(作家別)

次に、作業中の作品数が多い順のベスト10を、作家別にみてみます。2019年と2022年、いずれも1月1日現在の数です。
件数のうち、カッコ内は、作業状態が非公開/入力取り消しの数を除いた、実質的な作業中の件数になります。

表2. 作業中の作品数ベスト10(作家別)
2019 2022
順位 作家名 件数 順位 作家名 件数
1 田山 花袋 497(208) 1 山本 周五郎 441(441)
2 田山 録弥 482(196) 2 田山 花袋 423(134)
3 山本 周五郎 349(349) 3 田山 録弥 397(111)
4 小川 未明 340(340) 4 小川 未明 226(226)
5 野村 胡堂 147(141) 5 柳田 国男 142(142)
6 柳田 国男 142(142) 6 坂口 安吾 103(84)
7 大町 桂月 116(116) 7 谷崎 潤一郎 101(100)
8 中谷 宇吉郎 106(106) 8 大町 桂月 99(99)
9 岡本 かの子 102(102) 9 泉 鏡太郎 98(10)
10 泉 鏡太郎 98(10) 10 岡本 かの子 93(93)

これをみると、2019年の1位は田山花袋でしたが、2022年の1位は山本周五郎になっています。また、非公開/入力取り消しの数を除いたカッコ内の数でみると、2019年も2022年も山本周五郎が1位です。

参考までに、2019年1月1日から2021年12月31日までの、青空文庫で公開された作品の数を作家別にみると、次のようになります。

表3. 作家別公開作品数
(2019-2021)
順位 作家名 件数
1 小川 未明 114
2 中谷 宇吉郎 90
3 山本 周五郎 88
4 田山 花袋 87
5 田山 録弥 85
6 野村 胡堂 79
7 矢崎 源九郎 62
8 折口 信夫 55
9 北大路 魯山人 52
10 中原 中也 43

ここで、山本周五郎に注目してみると、2019年の作業中件数は349件で、そこから88件公開されたので、2022年には 349 – 88=261件になるはずなのに、2022年をみると441件となっています。これは、2019年以降に、441 – 261=180件の作品が、新たに入力作業が始まったことを示しています。
このように、作業中の件数の推移を考えるときには、ベスト10の件数だけでなく、公開された作品の件数や、新たに作業中に加わった件数もあわせて考えることが必要です。

作業中の作品数ベスト10(入力者別)

次は、作業中の作品数ベスト10、入力者別です。2019年と2022年、いずれも1月1日現在の数です。

表4. 作業中の作品数ベスト10(入力者別)
2019 2022
順位 入力者 件数 順位 入力者 件数
1 特定非営利活動法人
はるかぜ
973 1 特定非営利活動法人
はるかぜ
854
2 門田裕志 637 2 門田裕志 412
3 大野晋 359 3 大野晋 358
4 川山隆 265 4 フクポー 287
5 フクポー 251 5 川山隆 261
6 kompass 198 6 kompass 209
7 坂本真一 190 7 砂場清隆 179
8 H.YAM 156 8 sogo 160
9 田中哲郎 142 9 H.YAM 127
10 sogo 119 10 田中哲郎 126

2019年1月1日から2021年12月31日までに公開された作品の数を入力者別にみると、次のようになります。

表5. 入力者別公開作品数
(2019-2021)
順位 入力者 件数
1 特定非営利活動法人
はるかぜ
332
2 門田裕志 229
3 砂場清隆 103
4 坂本真一 77
5 kompass 73
6 sogo 58
7 フクポー 51
8 tatsuki 45
9 きりんの手紙 40
10 かな とよみ 37

 

作業中の作品数ベスト10(校正者別)

次は、作業中の作品数ベスト10、校正者別です。2019年と2022年、いずれも1月1日現在の数です。

表6. 作業中の作品数ベスト10(校正者別)
2019 2022
順位 校正者 件数 順位 校正者 件数
1 きゅうり 89 1 noriko saito 100
2 フクポー 74 2 木下聡 44
3 noriko saito 60 3 栗田美恵子 37
4 岡村和彦 56 4 トモタカ 35
5 酒井和郎 51 5 杉浦鳥見 34
6 hitsuji 48 6 きゅうり 33
6 酒井裕二 48 7 北川松生 32
8 木下聡 45 8 いとうおちゃ 30
8 結城宏 45 9 hitsuji 28
10 栗田美恵子 42 9 持田和踏 28

2019年1月1日から2021年12月31日までに公開された作品の数を、校正者別にみた表です。

表7. 校正者別公開作品数
(2019-2021)
順位 入力者 件数
1 hitsuji 142
2 noriko saito 122
3 木下聡 106
4 きゅうり 98
5 岡村和彦 96
6 きりんの手紙 90
7 フクポー 75
8 芝裕久 69
9 栗田美恵子 64
10 雪森 51
10 酒井和郎 51

 

おわりに

以上、青空文庫で公開される作品が、いくつかの作業段階を経て公開されるまでの状況について、2019年からみてきました。
新型コロナの影響で、作業が滞っている部分もあるようですが、たくさんの耕作員や青空文庫の中の人による作業が、今後も続けられることを願ってやみません。


4 Comments »

  1. 表の部分の誤りを修正しました。ゴメンナサイ。

    Comment by おかもと — 2022年4月30日 @ 9:05 PM
  2. おかもと様、はじめまして。
    伊藤優佑と申します。青空文庫内で校正をするとありました。入力終わった後などに知人でその道に精通している方に校正してもらうつもりなのですが、それについては許可していただけるでしょうか。

    Comment by 伊藤優佑 — 2022年5月19日 @ 4:40 PM
  3. ええと、当方ではわからないので、どなたかお答えを。

    Comment by おかもと — 2022年5月19日 @ 8:58 PM
  4. 伊藤優佑さま、
    今もここを読まれているといいのですが。

    > 伊藤優佑と申します。青空文庫内で校正をするとありました。入力終わった後などに知人でその道に精通している方に校正してもらうつもりなのですが、それについては許可していただけるでしょうか。

    OKかと思いますが、入力ファイルを他の耕作員が校正を行うという手順は変わらないです。
    あと、世間で言う「校正」と違って校閲的なことは行わないのでその点ご注意下さい。

    Comment by 一耕作員 — 2022年5月31日 @ 9:47 AM

RSS feed for comments on this post. TrackBack URI

Leave a comment

This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License.
(c) 2022 aozorablog | powered by WordPress with Barecity