スマホのスキャナ/OCR

スマホは何でもできる。レポートを書くとき、教科書をフラットベッド・スキャナでスキャンしてOCRをかけて文字化するなんてのは、もう古いのだろう。まだ大学1年生位だと、レポートに教科書の模式図をスマホで撮影してワードに貼り付ける程度だ。傾いていたり、背景が白でなくなっちゃうので、どうしても教科書の絵を使いたかったらスキャンして、白黒はっきりした図にしなさいといってある。勿論、誰かさんのように盗用にならないように引用元を明らかにしてだ。単なる写真の貼り付けはだめ、もしその図をつかいたかったら自分で新たにレポートに必要な部分のみぬきだして描けといっているけど、まだ1年生位では難しい。

2018.12.21(金)毎日新聞朝刊 1面の記事が下のスマホのスキャン結果画像だ。

スマホでスキャナアプリで撮影し(自動的に白黒になった)Google Driveにアップロード(自動的にpdfになった)し、パソコンにダウンロードしてパソコンのAcrobatで開き、スクリーンショットしたものである。

この写真を、スマホのスキャナアプリでOCRで文字化したのが以下である。

〕国際捕鯨委員会 〈ーWC) ー ー . ー 吻^ 繍, クジラ資源の保存と捕鯨産業の秩序ある発展 鱗帆 を目的に国際捕鯨取締条約に基づきー948年 に設立された国際機関。 日本は肛年に加盟した。 当初 ,は捕鯨国でつくる資源管理機関だっ たが丶 反捕鯨国が 増えて舵年に商業捕鯨の 一 時停止が採択された。 水産 庁によると8月時点で加盟国のうち捕鯨支持国は日本 や丿ルウエーなど虹カ国丶 反捕鯨国がオース卜ラリア やブラジルなど蜷カ国。 捕鯨支持国と反捕鯨国が激し

く対立している。…

スマホでかなりのことができるけど、OCRはいまいちだな。しかし、パソコンとスキャナがこんな小さいところにあるのだからすごいよね。

パソコンに落とした写真(pdf)をAcrobat の OCR で文字化したのが下である。

国際捕鯨委員会〈lWC 〉
時収禽クジラ資源の保存と捕鯨産業の秩序あ杯槍を目的に国際捕鯨取締条約に基づき1948 年
に設立された国際機関。日本は日年に加盟しは堵鯨園でつくる資源管理機関だったが、増えて回年に商業捕鯨の一時停止が採択さο一水産
庁によると8 月時点で加盟国のうち捕鯨支持やノルウェーなど引カ園、反捕鯨国がオやブラジルなど総カ国。捕鯨支持国とく対立している。

どちらも縦書きを認識している。コラムに分けられると、文字の認識はできるが、段を認識してくれないので編集が必要になる。

いまや学生さんはパソコンよりスマホだから、スマホで教科書を撮影してOCRで文字にしてレポートに転載するようになるのだろう。学年で誰か一人ができるようになると、あっという間にその方法は広まる。ネットのほうがもっと手軽で、Yahoo知恵袋からなんてのがいて驚くのは、こっちが古いか。

他所様の論文のOCRの結果そのままで論文に転載するという、すごい博士号を取得した方もいたね。

KCl  が KC1

になったままだったんだよね。Natureの論文だぜ。シニアも、そんな間違いはありえないと信用し見逃したから、騙されて悲しいことになってしまったわけだ。こういうところでもこの女史の普通でないところに気がついた可能性があるけどね。でもこのKC1女史は、なんとも思っていないんだろうね。

「スマホのスキャナ/OCR」への15件のフィードバック

  1. >学とみ子
    ため息ブログというのは、ことさら、他人のミスを強調したり(KCLの件)、自らの無知からくる誤解を正しいと信じ、さらにふれまわる人たちが集まっているようです
    (後略)
    2018/12/21(金) 午後 8:53

    アハハ・・・
    今度は、KCLになっちまった。元素記号なんだから、Lを大文字にしちゃダメでしょ。秀逸なギャグですね。

    1. >他人のミスを強調したり(KCLの件)

      これを殊更に”ミス”と些細な事のように書く事で、学さんの科学に対する姿勢&小保方氏への何が何でも擁護するのだ、との意思が他者にわかってしまう、というのが理解できないのがなんとも哀れです。
      単なるブログにおける軽口、雑文内ではなく、科学論文ですのでコピペ白状の明らかな”不正”だからこそ大事(オオゴト)ですのにね。

  2. はなさん
    多分学さんは、例のKC1が盗用がバレる切っ掛けになったことも、コピペの動かぬ証拠であることも理解されてないとおもいます。だから、なぜ今回の記事でこの話が引き合いに出されたなのかも解ってないのでしょうね。だから単純なミスをあげつらっているとしか考えられないのでしょう。それにしても、中学校で習う元素記号も正しく表記できないのは恥ずかしいですね。

    1. アノ姐さん
      >多分学さんは、例のKC1が盗用がバレる切っ掛けになったことも、コピペの動かぬ証拠であることも理解されてないとおもいます。

      いくら何でも、ため息先生がこの記事内でコピペについて書かれていて、かつ明らかに筆頭著者に言及しているのに、それはないのでは?と一瞬は思ったのですが、今までの学さんの記事、コメントから考えると、確かにあり得ますね。
      STAP問題についても、サラリーマン生活さん、軒下さんがおっしゃるように、一研究者ブログで色々な問題や出来事は、まさに科学的議論がされてきているのに、一周回って・・・初めてのように書いていたり、誰にともなく「それはどこにあるのか?」と聞いていたりしますし。

      あそこまでSTAP問題について書いているのですから、アノ姐さん、体内時計さんのように、しっかりとSTAP問題について体系的に整理なさっていて、細かな箇所もすぐに該当の文書、文章を出される(これには、いつも心から感嘆しております)まではいかずとも、幾人もの方がおっしゃるように、STAP問題の主な物には目を通し理解してからが良いのに(というか、それが通常ですが)と思う事しばしばです。

  3. 酔った勢いでコメントを。
    あちらのブログ主は自分の説を垂れ流し、こちらのブログにケチをつける一方で、他の行動をとらないのですね。
    そんなにSTAP細胞を証明したければ自分で研究者を雇って証明すればよいのに。
    あるいは自分の説をまとめて自費出版すればよいのでは?適当な言い逃れは通用しませんよ。かつて別の内容で本を出版されてるのですから。
    まあ、そんな本出したところで様々な方面からまっとうな意見での非難が集中するのがオチでしょうが。尤も、今更STAP細胞の本を書いたところで赤字にしかならないから出さないでしょうけれど。
    そして、かつて出版した本の内容以上にSTAP細胞に関心がないとこちらは解釈できてしまいますね。自身の説でSTAP細胞を証明したければ赤字覚悟で本を出版するはずですし。所詮、その程度でしょうね。
    とはいえ、某ビジネスジャーナルに投稿していた市民ジャーナリストみたいにデマを流すのは困りますね。尤も、そのジャーナリストの末路は自身の自爆により悲惨だったわけですが。
    あちらのブログ主も自分の発言に気を付けた方がいいと思いますよ。そうでないと、先述した某市民ジャーナリストみたいに自分自身には無論のこと、筆頭著者にも悪影響がありますよ(脅しではなく、アドバイスのつもりですが、前者に解釈されそうな。)。

  4. アノ姐 さん や はな さんがおっしゃるように学とみ子様はKC1事件が単なる誤植・ミスタイプではないのがわかってないんですね。なぜこのOCRの記事に出てくるのが全く理解できない可哀想な方なわけです。
    しかし、少なくとも医者で最高の教育を受けたのだから、塩化カリウムを KCL とか、水素イオン濃度を PH、Ph などと表記してほしくないですね。中学の理科、高校の化学くらいマスターしてくれないとね。この辺から再勉強してSTAPを語ってくださいと思うだけです。

  5. KCLもそうだけど、学様は言葉の使い方がとても無神経だし、不正確ですよね。あげくには、「遺伝子異常感知能力」なんて勝手な造語までしてしまうのですから。それでいて想像力を働かせて学様の主張を理解しろと言っているのですからねえ。(苦笑
    言葉というものは、ときには人を生かすこともあれば、殺しもします。臨床医であれば、言葉の正確さはもちろん言葉選びにも慎重であるべきなはずです。患者の生死に関わるからです。臨床医を名乗りながらこの無神経さは一体どうしてなのでしょう?

  6. 小保方氏が…」に2018/12/22(土) 午後 0:44 学とみ子が物事の順序がでたらめなんてほざいているのでコメントしてみました。コピーです。
    2018.12.22 14:03 頃

    > 学とみ子さん

    「KCL問題、コピペ問題は、STAPの新規性とは相容れない」かもしれませんが、論文に疑念がもたれる・不正の発覚の原因の一つでした。11jigenさんのページ、ttp://stapcells.blogspot.com/の「Guo Jianliらの論文との比較」を見てください、この件を知らないとでもいうのですか?

    「STAP細胞とは何か?」と理解を求めるのなら、これまでのSTAP事件の経緯をたどってみることを強くおすすめします。

  7. 学さんコメント2018/12/22(土) 午後 0:19  への返信です。

    >もっと、STAP細胞とは何か?を理解して上げて。
    お願いしますよ。

    STAP細胞とは、小保方氏が筆頭著者となり複数のシニア研究者と共に2014.1.30にNatureに発表した論文で提唱された細胞ですが、その後、数々の不正、疑惑が明らかとなり同年7月に撤回された論文です。
    論文撤回によりSTAP細胞は無かったと理解しております。

    それが何か?

  8. ゆうべ揶揄して未承認かと思ったら載ってました。本当に誰にも相手にすらされなくて、そしたらここで議論してくれて嬉しくてたまらないのでは。光が当たった気分かも。こわれ楽器さん、学問的な支援してましたっけ?

  9. こわれ楽器さんは、始めから科学的な内容を理解することを放棄してますからねぇ。
    ひたすら、情報公開請求とMTAがーと、FES1の出所がーだけですから。(笑
    そもそも、不正調査は、論文に不正があるかどうか調べたということで、結論は筆頭著者によるデータの捏造改ざんがあったという単純な話なんですけどね。学様もこわれ楽器さんもSTAP細胞がES細胞であろうがなかろうがこの結論には何ら影響しないということが理解できないのですよね。なぜならES細胞の混入は、誰がやったかも不明、故意か事故かも不明とされていて、調査委員会は不正かどうかの判断はしていないからです。

  10. 私も見事にバカ認定で光栄の至りです(笑)。この騒動の議論に敢えて参加するには、一々腹をたてていたら身が持ちませんね。皆さん、どんと太っ腹でいきましょう。
    「一研究者ブログ」以降の新たな知見?STAPの新規性?確かにデータに裏付けされたその様なモノがあるなら、狭いブログの世界で閉じ籠らす、筆頭著者にアクセスするなり、幹細胞の専門家に協力を求めるなり、活動の仕方はある筈ではありませんか?その様な形で話が前進するなら、私はむしろ声援を惜しみません。そちらにエネルギーを注がれるべきではないでしょうか。

  11. >「一研究者ブログ」以降の新たな知見?STAPの新規性?確かにデータに裏付けされたその様なモノがあるなら、狭いブログの世界で閉じ籠らす、筆頭著者にアクセスするなり、幹細胞の専門家に協力を求めるなり、活動の仕方はある筈ではありませんか?

    サラリーマン生活28年さんの仰る通りですね。
    研究不正で取り下げられ、疑惑のあったデータが筆頭著者から全く出されない論文について、可能性を模索することに何の意味があるのか、理解に苦しみます。

    5ちゃんで指摘されていますが、RNA-seqのデータについては、伊藤先生の会見での言葉が全てだと思います。

    https://www.youtube.com/watch?v=-JMXa_IjdbA&feature=youtu.be&t=4779

  12. 誰かさんの頭の中は「もんじゃ焼き」になっとりますな。色々混ざってグッチャグチャ、湯気を立ててアッチッチということです。(笑

  13. 学さんブログのLさんのコメント(https://blogs.yahoo.co.jp/solid_1069/15793603.html#15797650)にお返事させていただきます。

    【考え直すところがない完璧な報告がなされたと思っている人も、あまりいないのではないでしょうか? 皆さんが一方的にたたくから、矛盾点について口を挟みたくなるんですよ。黒か白かではないですから。】

    完璧な報告がなされなかった一番の理由はなんでしょうか。私は小保方氏からほとんどオリジナルデータが出されなかったことだと考えていますが、この最も重要な部分を避け、調査報告書に難癖をつけている方に対して、STAP細胞に希望を持つかのようなコメントをする事が科学者として正しい行為なのか、私にはわかりません。

    いまだにSTAP細胞に可能性を感じるのであれば、ネットの世界で誰かを非難したり、擁護するのではなく、直接STAP論文の筆頭著者にコンタクトを取るか、論文として発表するべきではないかと思うのですが。

    【この動画では、伊藤氏のコメントの後、宮田さんが本質的な質問をされてます。この質問に対する桂先生の回答、及び桂報告書の「まとめ」の後半部分、を研究者は自分事として考えるべきです。一個人の不正問題よりも、はるかに重要な問題と、個人的には思っています。】

    動画を確認しました。
    研究者のほとんどが、Lさんと同様、桂先生の言葉や桂報告書の後半部分を、「一個人の不正問題よりも、はるかに重要」と考えていると思います。いまだに小保方氏が行った不正問題に関心を持っている研究者はほとんどいないでしょう。
    それと同時に、「たまたま小保方氏と共同研究する立場にはなかった大部分の研究者も、もし自分が共同研究をしていたらどうなったかを考えると、身につまされることが多いだろう」という報告書の部分に共感したのであれば、強く若山氏をを批判することはしないはずです。研究者からは若山氏を批判する意見よりも、若山氏に対して同情的な意見の方が遥かに多かったように記憶していますので、多くの研究者は自分に置きかえて、この事件に向き合い、自分自身への戒めとしたのではないでしょうか。

    Lさんが今でも若山氏への批判を続けるということは、ご自分だったら、小保方氏の不正を見過ごすことはなかった、最初のキメラマウスができた時、また、ジャームライントランスミッションの実験の際、マウスの遺伝子型をきちんと精査すれば、という思いが今でもおありになるのではないかと推察しています。
    Lさんのコメントからは、学生や研究生に対する誠実さが感じられますし、彼らとのコミュニケーションも欠かさないPIなのだろうと思います。Lさんの研究室であれば、STAP事件は起きなかったのかも知れません。
    ただ、それもすべて過去の事です。繰り返しますが、STAPに可能性を感じているのであれば、小保方氏にオリジナルデータを出して説明してもらう以外にありません。どの実験のときにどの細胞を使ったのか、実験ノートに記載がなくデータも出されない中で、「STAP細胞」について議論することに意味も必要性も感じません。

    【思いやっているわけではないんですが、アンフェアな感じがするんですよね。特に、本人が研究者として再起したいと思っていた場合には。】

    西川氏はご自身のブログ(https://news.yahoo.co.jp/byline/nishikawashinichi/20160130-00053948/)で、
    「今回の事件では多くの研究者がSNSで意見を拡散させ、メディアに理由もなく寄り添った。しかし、もし小保方さんがこれに対し手記でしか答えないとしたら、自ら科学者への道を閉ざしたことになる。」
    と書いています。
    Lさんは「あの日」を読んでいらっしゃらないようですが、科学的的なエビデンスを出さず、手記で他の研究者に疑惑を向けた研究不正者が再起を望んでいたのか、「あの日」の中にその答えを見つけることができるかもしれません。
    また、個人的には「あの日」を読まずに、遠藤氏の意見を「エビデンスとしては同じ」と語ることもアンフェアだと考えます。

    【黒か白かではないですから。】

    STAP問題において「黒」となるのは、ES混入者の自白以外にないでしょうね。
    余談ですが、先月、仕事で「限りなく黒に近いグレー」の案件がありました。明らかに「黒」なのですが、証拠がありません。
    「黒」だと証言してくれた方が現れたのですが、その方を守るために、その証言を採用することができません。
    結局、「限りなく黒に近いグレー」が、本当にひょんなことで自滅してくれたおかげで、その事件を「黒」とすることができました。
    「悪いことはできないね」と心から感じた瞬間でしたが、こんなことは滅多にないと思われますし、本当にたまたま偶然が重なって生じた「自滅」でした。
    「限りなく黒に近いグレー」を「黒」とすることは非常に困難であり、調査委員会の権限では不可能だったのだろうと推察します。まして、ネットの世界で語ることではないのでしょうね。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください