誰の物かわからないだろう。
氏名、生年月日、男女の区別が分かっていても、突合せは不可能だろう。
1)氏が正しく、名が間違っている場合、逆の場合、両方が間違っている場合
2)誕生年は正しいが、月、日が間違っている場合、年が間違っているが、月が合っているが、
日が更に間違っている、年、月はあっているが、日が違っている場合、全て間違いの場合
3)性別が違っている場合
性別だけが違っており、その他が一致しておれば、受給者に連絡すべきだろうが、
氏名はあっているが、生年月日が多少違っている場合、どうする?
まずは、5000万件のリストをWebで公開することだ。
Webを大部分の方は使えないだろうが、家族、親戚やボランティアが代行すればよい。
当然、検索条件の入力を可能として、ヒットしたリストを表示できれば十分ではないかな。
突合せ用ソフトを開発する必要があるが、どういう仕様にするのだろう。
例えば、「ヒデキ」は秀樹、英樹、英機、秀喜、秀紀、その他色々あるので、まずはカタカナ名を
漢字に直し、その後に、同じ漢字名の人の氏、生年月日をつき合わせ、全てが一致すれば
よいが、生年月日の例えば、「日」が違っていた場合はどう判定するかが難しい。
苗字についても、
「ワタナベ」は渡部、渡辺、渡邊、渡邉ぐらいだろうが、渡部は「ワタベ」と読まれている可能性が
あるので、これも漢字で付き合わせる必要がある。すると、ワタナベ ヒデキさんを漢字に直すと、
渡部秀樹、渡部秀樹、その他色々出来る。
また、ワタベ ヒデキさんも、渡部秀樹、渡部秀樹、その他色々出来る。
漢字で見ると、ワタナベヒデキさんとワタベヒデキさんは同じ方である可能性がある。
こういうソフトを造ることは容易だろうが、5000万件を一件毎に年金保険番号毎につき合わせて
行く事には、コンピュータを使ってもすごい時間が掛かると思う。
処理時間を計算すると、
消えた年金件数=50000000件
受給者数=30000000人
一件当たりの処理時間=1秒
一日の秒数=86400秒
単純な突合せ日数=消えた年金件数*受給者数*処理時間/一日の秒数
=17361111111日
一件、1秒は長いようにも感じるので、1msとすると、
単純な突合せ日数==17361111.111日
まだ、長いとおもうので、1μsとすると
単純な突合せ日数=17361.111111日
コンピュータのスピードはもっと高速だが、ファイル処理をしなくてはならないから、これ以上は
早くならないとおもう。
消えた年金件数ファイルと受給者ファイルをメインメモリに上げて処理すると、
1nsで処理できるとすると、
単純な突合せ日数=17.361111111日
で出来ることになるが、ファイルの容量が不明なのだが、
氏、名、生、年、月、日、男、女で同じような処理をしたとすると、17日の8倍の日数
単純な突合せ日数=138日
で完了となるが、付随処理も必要だろうから、1ns/件で処理できるとは思えない。
どこか考え違いがあることを望むが、単純ソートなので、大体合っていると思う。
希望として考えられるのは、漏れなく受給している方が大部分なら、その部分のソートを
外せば、外すほど、短期間で可能となるが、外す処理が難しいのかも知れない。