※苦情を入れる前に最後までお読み下さい。
将棋界に暗い影を落とすソフト指し疑惑。
残念なことに、今回ある棋士に新たにソフト指しの疑いが浮上しました。
その棋士とは、あるトップ棋士が「強い部分はけた違いに強い」と評した棋士です。
「強い部分は」という表現が引っかかりますね。やはりトップ棋士にはソフト指しがわかるということでしょうか。
では早速その棋士がソフト指しをした証拠の数々を見ていきましょう。
一致率が異常に高い?
まず、下記のグラフをご覧ください。
疑惑の対局が5局あるのですが、視覚的にもこの5局が飛び抜けていることが解ると思います。
特にうち1局は一致率が100%と驚異的な数字を叩き出しています!
こんなの聞いたことがありませんね。
それだけではありません。
なんと、この高一致率を示した5局では、全て疑惑の棋士が勝利しています。
カンニングをした対局は確実に勝利しているわけですね!
グラフをみるだけで計算するまでもなくカンニングは明らかですが、この5局の一致率がどれくらい高いのかを見ていきましょう。
まず、平均値ですが、疑惑局を除いた平均値が46.10%
疑惑局の平均値が87.66%となっています。
これだけでまずそうですが、いよいよ統計処理を行っていきます。
LibreOffice CalcのT検定にこのデータをかけてみました。
P(T<=t) 両側 1.11244913132405E-05
なんということでしょう。
一般にこの手の検定では有意水準αは5%や1%という値がとられることが多いのに対し、有意水準α=0.0011%というとんでもない数字がでてしまいました。
はっきり統計的に有意といえます。
これは言い逃れが出来ませんね。
素行も悪かった?
この棋士、一致率が高いだけでなく、素行も悪いというのです。
彼は当時、なんと酒に溺れ賭博をしていたというのです。
それどころか、過去に賭け将棋を行い、逮捕されそうになったというエピソードもあります。
賭博でお金に困り、ソフトに頼ったカンニングで賞金を稼ごうとしたのでしょうか。
動機まではっきりしているとは、もはや黒と判断せざるを得ません。
その棋士の名前は?
「天野宗歩」です!
将棋ファンの皆様には説明不要とは思いますが、彼は江戸時代の伝説的な棋士です。
彼はタイムマシンで未来からコンピュータを持ち込み、カンニングをしていたと考えられます。
「江戸時代の棋士ならソフトの学習用棋譜にデータが入っていたため一致率が高いのでは?」と思われるかも知れませんが、一致率100%の棋譜については代表的な将棋ソフトのBonanza、技巧、Aperyともに学習データに入っていないようです。
また、「タイムマシンは現実的ではないのでは?」と思われる方もいらっしゃることでしょう。
しかし、該当棋譜の一致率の特異性が統計的に有意である以上、彼がソフト指しをしていたことは間違いないのです。
数字は絶対です。嘘をつきません。
まとめ
いかがでしたか?
天野宗歩がタイムマシンを使って未来からコンピュータを持ち込んだことがわかりましたね!
タイムマシンが存在する時代からきたということは、天野宗歩は江戸時代の棋士ではなく未来の棋士と呼ぶべきかも知れません。
タイムマシンを研究している皆様に少しでも希望を与えられれば幸いです。
--解説--
主に三浦九段冤罪事件のときに、三浦九段を黒だと主張する人たちが使っていた手法をそのまま天野宗歩に適用したら、天野宗歩がタイムトラベラーになってしまったという話です。
具体的には以下の6点です。
・計測条件の異なる複数のデータを意図的に混ぜ合わせて使用する
・上記データの計測条件の違いを無視し、信じられないほど雑な統計処理を行う
・一致率の測定後、一致率を最大化するように測定範囲を変更する
・勝局の一致率が高いという割と当たり前なことをいう
・プロの発言を中途半端に抜粋してあたかも疑惑が強いようにみせかける
・不正行為と特に関係のない行動やエピソードを並べて不信感を煽る
主にTwitter上の某関係者やどこぞのオープンな感じの似非科学ブロガーがよく使ってましたね。(アクセス数に微塵も貢献したくないのでリンクは貼りません)
一致率に関する項目が多いですが、「数字は嘘をつかないが、嘘つきは数字を使う」というやつですね。
※計測条件の異なる複数のデータの比較の悪質な例として、一致率をはかる指し手の抽出条件が異なるデータの比較があります。事件当時、①駒がぶつかってからの一致率、②将棋ソフトの定跡部を除いた一致率、③終盤3分の1のみの一致率、そして④一致率を最大化するために範囲を変更した一致率データなどが出回っていました。特に④と②では同じ棋譜、同じソフトを使っていても10%〜20%程度一致率が変化したと記憶していますが、これらを直接比較する記事などが実際に見受けられました。
他に「当事者の勝局と他人の敗局を比較」など色々な手法があるのですが、全部入れるのは大変だったのでやめました。
これらの手法はネット将棋のソフト指しの検証にも用いられるようです。
最近のとあるYouTuberの方のソフト指し疑惑関連のツイートをチラ見すると、三浦九段冤罪事件の時と同じ論法が散見されます。
頼むからあなたたちは過去から学んで下さい。
さて、ソフト指しの検証によく用いられるこの一致率という手法ですが、将棋倶楽部24が示した指針が大きな影響を与えていると思います。
参考URL:https://www.shogidojo.net/info/rule/soft.html
【2019/08/30追記】
Twitterでご意見をいただき、こちらの項を修正いたしました。以前この項に記述していた文章は、私が24の基準を他サイトに掲載されていた基準と混同し、不正確な内容が含まれていたため訂正してお詫び申し上げます。
以下の文章は8月30日に新たに書き直したものです。
この式単体を見ても様々なパラメータを決める仮定の根拠が示されていないなど問題があります。
更に問題なのは、この式はあくまで「一致率が高くなる確率」ではなく「一致率が100%になる確率」を求めているにも関わらず、実際の運用では一致率が100%に満たなくともアカウント停止処分をしていることです。
近年の将棋ソフトはわずかな条件の違いで指し手が変動するため、同じソフト同士ですら平均一致率は75%止まりです。(本記事のおまけ参照)
一致率75%以上なら、技巧による羽生九段の対局612局の解析結果を単純に調べても、どちらか一方の対局者がこの値を超える対局は10局に1局程度存在します。
一致率に戦型依存性などがある可能性も考慮すれば、人によってはより高頻度で高一致率の対局が出現してもおかしくはないでしょう。
それなのにさも少数の一致率の高い棋譜でソフト指しが見抜けるかのような書き方をすることは、界隈全体に大きな悪影響を与えます。
将棋倶楽部24も無料のネットゲームなので、運営コストの削減のため誤BANがありえる前提で一致率を根拠にすることは仕方ないとは思いますが、それを正当化するために意図的にミスリードを誘う表現をするのは流石に養護できません。
【2019/08/30追記ここまで】
最後に
「推定無罪」という言葉を思い出しましょう。
それが受け入れられないなら、それこそタイムマシンを発明して中世にでも移住してください。
きっとあなたが大好きな魔女裁判がたくさん見られると思いますよ。
--使用したデータ--
http://m.chiebukuro.yahoo.co.jp/detail/q1338088998
https://drive.google.com/drive/folders/0B4KBABFDKTAnUTlaOTM5cWlpRWs
--参考文献--
https://shogi1.com/japan-shogi-taikei/
https://ja.wikipedia.org/wiki/%E5%A4%A9%E9%87%8E%E5%AE%97%E6%AD%A9
https://edo-g.com/blog/2016/06/professional.html
--おまけ--
Twitter上の西尾七段のツイートが非常に参考になりますので、紹介いたします。
解析して興味深いのは、友人棋士複数が左図の▲63桂成△同角▲85飛や右図の▲73歩成△同銀▲72銀△同角▲同飛成△62飛▲81角の手順をソフトっぽいと評していたが、少なくとも技巧(5960X、60秒、試行回数100回)はこれらをほぼ指さない。こうした感覚はあてにならないことも多い pic.twitter.com/5QhKeJk6Tt
— 西尾明 (@nishio1979) October 30, 2016
例えば下図、Core i7-5960X、思考時間10秒という条件下において技巧は以下の確率で指し手が分かれました(試行回数1000回)。解析時にどちらの手を選ぶかによって一致率は変化します。25〜91手で解析すると先手の指し手は全部で34手。一手辺り約3%近く変わってきます。 pic.twitter.com/d0ug6Fknwh
— 西尾明 (@nishio1979) October 27, 2016
選択肢少なめで短手数、ある程度研究範囲内といった条件が揃い、さらに使用ソフトや探索時間を変えて解析すると(マルチスレッドでは同条件でも)高一致率を抽出しやすい。私の叡王戦1回戦の将棋はこの条件を満たしているのでやはり高く出る。前例後から5960X、白美神、探索時間10秒の解析。 pic.twitter.com/fPPGYMMx36
— 西尾明 (@nishio1979) November 18, 2016
先日の叡王戦の豊島-千田戦も先述の条件を満たしていそうなので、やはり高い。前例後から5960X、真やねうら王、10秒の解析。チェスの論文でも言及されていましたが、短手数で高一致率が出るのはそんなに珍しいことではなさそう。手数と一致率の関係は調べておきたいですね。 pic.twitter.com/0ZsTKpSWMu
— 西尾明 (@nishio1979) November 18, 2016
一致率含め色々とまだ認識が低いようで、チェスを参考にこれから整備が必要ですね。https://t.co/KcMBgBiRx6
— 西尾明 (@nishio1979) February 26, 2017
あとあまり知られていませんが、「ソフトは基本アルゴリズムが似てるから、別種のソフトでも高い一致率が出る」というのは不正確です。
プロとソフトの一致率とソフトと別種のソフトの一致率は似たようなものでした。(今のソフトで検証するとまた違う結果が出るかも知れません。)
技巧解析による一致率
— 緑SM64 (@MidoriSM64) November 13, 2016
ソフト名:狭義平均(偏差)広義平均(偏差)
GPSfish:59.8%(10.3)74.9(8.6)
Bonanza:58.5%(8.7)76.6(6.8)
浮かむ瀬:61.8%(7.0)71.3(6.7)
技巧:75.8%(6.7)89.6%(4.0)
「ネット将棋は早指しだからプロ棋戦より大幅に一致率が落ちる」というのもあまり言えないようです。
dcsyhiさん(ネット将棋強豪)技巧6s解析
— 緑SM64 (@MidoriSM64) November 19, 2016
平均一致率(狭義[偏差],広義[偏差])
58.2[10.72],73.5[10.04]
最高一致率(狭義,広義)
87.5,100
最高一致率(解析対象手数が10手未満のものを除く)
87.5,95
「技巧登場前からiOSに昔から桜花というアプリがあるからずっとカンニングしてて一致率が高かったのでは?」というのは笑っちゃうくらいデタラメです。
三浦九段冤罪事件に関する根も葉もない噂に「技巧リリース以前はiOSの桜花というアプリでカンニングしていた」というものがありますが、うちのiPhoneで確認したところ桜花はBona6のDepth7=fgの約R2000~2250のはず。到底プロがカンニングに使えるものではありません。
— 緑SM64 (@MidoriSM64) February 19, 2017