ヘッドライン



wellcome



過去記事

日本古典文学ファンのタイ人がAIくずし字認識アプリ開発するも、日本の研究者が「望ましくない」と批判

2021年10月15日金曜日

IT

hello
t f B P L
>>おすすめ おまとめ<<
1 :名無しさん@おーぷん:21/10/11(月)19:40:11 ID:nWLn
(略)
タリンさんはタイの首都・バンコク出身。日本の古典文学に魅了され、大学院進学とともに1人で来日した。
大学院での専攻は『源氏物語』の古注釈ながら、古典文学の魅力を少しでも多くの人に伝えるために、AI(人工知能)によるくずし字認識に取り組み始めた。
彼女が開発したくずし字認識スマホアプリ「みを(miwo)」はSNS上などで大きな話題になった。
スマホやタブレットのカメラでくずし字資料を撮影し、ボタンを押すだけで、AIが1枚あたり数秒でくずし字を現代の文字に変換するアプリだ。
精度は江戸時代の版本では約95%におよぶ。
彼女は2021年8月31日にROIS-DS人文学オープンデータ共同利用センター(CODH)、国立情報学研究所(NII)を退職し、
9月6日にグーグル合同会社 AI開発部門 Brainチームのリサーチ・サイエンティストとして入社した。
(略)
「『AIによるくずし字認識は望ましくない』『こんな研究は良くない』という国文学研究者が何人かいました。
古典文学を広めようと頑張っているのに、自分が所属する分野の人たちに反対されるのはつらいです」
(略)
https://ledge.ai/tkasasagi-interview/
2: 名無しさん@おーぷん:21/10/11(月)19:42:53 ID:HwiJ
うーんこの
3: 名無しさん@おーぷん:21/10/11(月)19:42:57 ID:XFUH
くずし字が読めなくて中世近世専攻を諦めた史学科ワイ
タリンさんを神と崇める
4: 名無しさん@おーぷん:21/10/11(月)19:43:06 ID:VzJV
これで国会図書館のサイトで電子書籍として自由に閲覧出来る古文書みたいなやつ読めるやん
あれも手書きのくずし字やなかったっけ
5: 名無しさん@おーぷん:21/10/11(月)19:43:52 ID:nWLn
>>4
古文書は基本的に手書きのくずし字やったはず
6: 名無しさん@おーぷん:21/10/11(月)19:44:06 ID:Jsmp
なんで望ましくないんよ?
10: 名無しさん@おーぷん:21/10/11(月)19:47:21 ID:HwiJ
>>6
自分たちの仕事がなくなると思っているからやろ
7: 名無しさん@おーぷん:21/10/11(月)19:44:36 ID:XFUH
翻刻されてない資料クソほどあるしな
くずし字なんて日本人の99%は読めないんやし
自国の史料を読めないなんて悲しいことやで
11: 名無しさん@おーぷん:21/10/11(月)19:47:56 ID:HwiJ
>>7
そうなん?
8: 名無しさん@おーぷん:21/10/11(月)19:44:54 ID:nWLn
AIの力で崩し字が分かっても、読むには古文の知識が必要やけどな
9: 名無しさん@おーぷん:21/10/11(月)19:45:47 ID:9zdD
最終的には自分で読めるようにならんとあかんしアプリなんてべつにいらん
12: 名無しさん@おーぷん:21/10/11(月)19:49:35 ID:nWLn
>>9
確かにそうかもしれんな
13: 名無しさん@おーぷん:21/10/11(月)19:50:20 ID:XFUH
>>9
アプリで読めれば自分で読めるようになる必要なくない?
14: 名無しさん@おーぷん:21/10/11(月)20:02:48 ID:nWLn
>>13
古文書を読むには崩し字の知識と古文の知識が必要なんやで
15: 名無しさん@おーぷん:21/10/11(月)20:13:02 ID:9zdD
>>13
毎回毎回アプリでやるより自分の頭でやったほうが速くね?一気に数ページ解析できるアプリやったら便利だけど
17: 名無しさん@おーぷん:21/10/11(月)20:14:38 ID:FNka
>>9
その最終的を求めてるやつ何人いるんだよ
18: 名無しさん@おーぷん:21/10/11(月)20:15:40 ID:9zdD
>>17
近世とか史学専攻は必要やろ。具体的数は知らん
20: 名無しさん@おーぷん:21/10/11(月)20:17:19 ID:FNka
>>18
んじゃその人らはアプリを頼らず学習すればいいんじゃない
それ以外の人はアプリに頼ればいんじゃね
23: 名無しさん@おーぷん:21/10/11(月)20:20:39 ID:9zdD
>>20
せやな
16: 名無しさん@おーぷん:21/10/11(月)20:13:48 ID:iNi8
すごいやん
19: 名無しさん@おーぷん:21/10/11(月)20:17:17 ID:6npZ
すげえなこれ
21: 名無しさん@おーぷん:21/10/11(月)20:18:35 ID:OWpW
外国語自動翻訳アプリと同じやろ
本格的にそれを勉強するもんは頼ったらあかんけどそうでないもんが使うには別にええんちゃう
25: 名無しさん@おーぷん:21/10/11(月)20:22:05 ID:6npZ
>古文の翻字には専門家でも1枚あたり約10分はかかるが、これらのAIでは1枚を約1秒で解読できる。
書物にもよるが、1時間あれば1冊を翻刻可能だ。
古注釈の研究が大変だから検索の部分を機械に任せたい。
彼女の理想は少しずつ現実のものになっていった。
>日本人にはくずし字の前には「大きな壁」が立ちはだかっている。
現在、くずし字をきちんと読める人は日本の人口のたった約0.01%、約数千人しかしない。
現存するくずし字資料は古典籍が300万点以上、古文書は個人の日記や手紙などを含めると1億点以上におよぶ。
約数千人かあ……
26: 名無しさん@おーぷん:21/10/11(月)20:23:42 ID:gs7T
>>25
あんなん現代の日本語の欠片もないし…
これで候とかやで
34: 名無しさん@おーぷん:21/10/11(月)20:32:56 ID:nWLn
>>25
ひょっとしたら新発見ありそうやな
36: 名無しさん@おーぷん:21/10/11(月)20:34:29 ID:gs7T
>>34
眠ってる史料とかかなりあるからな
大学でそこら辺の家から史料借りてきて整理するみたいな授業やったけど「コイツが借金踏み倒して江戸に逃げたンゴ!捕まえて!」みたいな訴訟とかあったり楽しいで
48: 名無しさん@おーぷん:21/10/11(月)20:44:50 ID:9roF
>>36
うわ、面白そう
東洋史専攻だったけど、日本近世近代史にも関心あるわ
27: 名無しさん@おーぷん:21/10/11(月)20:26:37 ID:6npZ
これで代々家にある謎の巻物とか翻訳してそれググって素人でもなんとなく何書いてあるかわかるってことやろ
やべーやんなんでも鑑定団
28: 名無しさん@おーぷん:21/10/11(月)20:27:34 ID:1JpN
学者側の言い分もあるんやろうが
やってる事はただの老害やな
29: 名無しさん@おーぷん:21/10/11(月)20:27:43 ID:gs7T
何がめんどいって書き手によって崩し方が微妙に違うのがめんどい
要はただのチャラ字やからな
30: 名無しさん@おーぷん:21/10/11(月)20:29:09 ID:2hyF
要は自分らに入る作業代が無くなるからやろ
31: 名無しさん@おーぷん:21/10/11(月)20:29:24 ID:wheM
サンキュータリンさん
32: 名無しさん@おーぷん:21/10/11(月)20:31:49 ID:gs7T
仍如件とか申上候事みたいな定型文とかはもはや所見じゃ文字数すら分からんくらいにくずれてることもあるし
33: 名無しさん@おーぷん:21/10/11(月)20:32:19 ID:nWLn
古文を翻訳できるサイト出てこないかなー
35: 名無しさん@おーぷん:21/10/11(月)20:33:11 ID:rufD
顔は崩れていても崩れ文字を読めないキモオタクj民
37: 名無しさん@おーぷん:21/10/11(月)20:36:24 ID:6npZ
日本の社会史的な研究がかなり発展するんやないかね
39: 忍【LV19,がいこつけんし,AF】:21/10/11(月)20:37:18 ID:gs7T
>>37
中世近世はともかく近代史は掘ればいくらでも出てきそう
38: 名無しさん@おーぷん:21/10/11(月)20:36:28 ID:maYb
いくら叩かれようと使ってないアピールしながらみんな使うだけや
翻訳サイトと同じ
40: 名無しさん@おーぷん:21/10/11(月)20:37:35 ID:2hyF
反対してるやつの具体的な理由が知りたいとこやね
44: 名無しさん@おーぷん:21/10/11(月)20:42:48 ID:nWLn
>>40
わかる
41: 名無しさん@おーぷん:21/10/11(月)20:39:45 ID:EvVL
ハードルが下がると自分達の権威が揺らいで困るってのはあると思う
ひと昔前は中国史の学者なのに中国語読み書きできないとかが割といて
学生を語学留学させちゃうとレ点とか付けて解読してる自分らのやり方が通用しなくなるから反対みたいな話があった
42: 名無しさん@おーぷん:21/10/11(月)20:40:33 ID:4JYm
ネット上の有志のお陰で翻訳家の仕事がクソ削られてるみたいだし気持ちは分からんでもない
43: 名無しさん@おーぷん:21/10/11(月)20:40:37 ID:maYb
共通試験の古文が原文なのも意味ないよね
45: 名無しさん@おーぷん:21/10/11(月)20:43:08 ID:gs7T
>>43
国文学でもやらない限りあんな文法的な解釈意味ない気がするんやがどうなんやろ
51: 名無しさん@おーぷん:21/10/11(月)20:47:27 ID:maYb
>>45
まず文科省が提示してる古文を学ぶ目的が
「日本の昔の風〇文化を知る」だから原文でやる必要は全く無いんや
52: 名無しさん@おーぷん:21/10/11(月)20:48:37 ID:nWLn
>>51
はえー
54: 名無しさん@おーぷん:21/10/11(月)20:49:26 ID:maYb
>>52
漢文も「古代日本に影響を与えた文章と文化を知る」だから同じくね
57: 名無しさん@おーぷん:21/10/11(月)21:13:29 ID:nWLn
>>54
なるほど
46: 名無しさん@おーぷん:21/10/11(月)20:43:32 ID:9roF
ええことやないか
そして自分で学ぶ意欲も高まるで
趣味で少しずつ覚えていくで!
47: 名無しさん@おーぷん:21/10/11(月)20:44:15 ID:gs7T
外国人からしたらまず現代の日本語でもないし文字もワケわからんしでレベル高過ぎなんやろな
49: 名無しさん@おーぷん:21/10/11(月)20:46:15 ID:nWLn
>>47
英語圏の人にとっては現代日本語すら難易度高いししゃーない
50: 名無しさん@おーぷん:21/10/11(月)20:46:28 ID:JNsU
『AIによるくずし字認識は望ましくない』『こんな研究は良くない』
翻訳:仕事を奪うな。ドヤ顔させろ。
55: 名無しさん@おーぷん:21/10/11(月)20:49:47 ID:2hyF
まあ実際の字にあたることで見えてくるものがあるとかなんだろうが本音のところは>>50やろな
53: 名無しさん@おーぷん:21/10/11(月)20:48:45 ID:JNsU
変体仮名ってレパートリーが多いからAIとしてはかなり高度だと思うけどね
59: 名無しさん@おーぷん:21/10/11(月)22:47:36 ID:nWLn
>>58
有能
60: 名無しさん@おーぷん:21/10/11(月)22:50:59 ID:HwiJ
>>58
なお日本
青空文庫「翻刻や校訂には著作権が発生すると考えられている」

61: 名無しさん@おーぷん:21/10/11(月)22:51:42 ID:7gM0
日本の古典って他国と比べて死ぬほどつまらないのによくハマったな
【元スレ】https://hayabusa.open2ch.net/test/read.cgi/livejupiter/1633948811

まるの制作部(動画、プログラム、絵、ブログ運営)

ヘッドライン



farewell

カテゴリ

このブログを検索

自己紹介

自分の写真
作らなきゃ(使命感)

QooQ