反省文を書きます。
誤読したのは下記記事。
記事の中で取り上げられている件について、ドコモからは下記案内が出ている。
誤読した点は下記4点。
解析および販売の対象となるデータの範囲
記事4段落目
契約者の携帯電話番号や生年月日などの個人情報
は基地局が収集するデータ
には含まれると書かれているものの、解析するデータ
にも含まれるとは書かれていない。にも関わらず、この段落に含まれる2つの文を続けて読んでしまったため、解析後の販売データにもこれらの個人情報が含まれていると誤読していた。
ドコモのお知らせからリンクを辿っていくと、下記ページにある通り、これが誤読であることははっきりしている。
モバイル空間統計では、運用データのうち電話番号の様な個人を識別できる情報を使用しません。また、生年月日を年齢層に変換するなど情報の要約を行います。
モバイル空間統計の作成手順
2013年9月6日現在
解析中および販売に向けての加工作業の内容
記事4段落目
その他の情報は加工して個人が特定できないようにする
に対して懐疑的な見方を向け、実際には個人が高精度で絞り込めるのではないかと根拠もなく邪推していた。記事見出しの ビッグデータ という単語を見たときから、根拠もなく 匿名化の程度はさておき、集計前の生情報が販売される と思い込んでしまったことがそもそもの敗因である。
ドコモのお知らせおよびそのリンク先によれば、加工には3段階の手順があり、その中に
集計処理
が含まれていて、販売されるデータは集計後の統計情報であるという。集計後の統計情報は、ドコモの携帯電話普及率をもとに推計した属性別人口だというから、私の邪推は勘違いも甚だしい。
属性別に携帯電話の台数を数え、さらに、ドコモの携帯電話の普及率を加味することで、ドコモのお客様以外の方々までも含む人口を推計します。この処理を「集計処理」と呼びます。
モバイル空間統計の作成手順
2013年9月6日現在
Suicaとの関連
記事5段落目でSuicaについて触れている。
記事にある以上の意味合いは無かったのであろうが、ここでも私は邪推をして、Suicaと同様にドコモも集計前の生情報を売ろうとしているのかと早合点した。
記事の長さ
よく見ると日時の括弧書きの下に、読売プレミアム登録者用のボタンがあった。
ここにある5段落が記事全文では無い可能性が高い。
しかし誤読した段階では、括弧書きの部分で記事が終わっていると完全に思い込んでいた。
もしこの先にも記事が続いていると考えられれば、その先により詳しい言及がある可能性にも思い当たったかもしれないが、後の祭りである。
非常に恥ずかしい思いをした。
この思いを繰り返さぬようにしていきたい。
0 件のコメント:
コメントを投稿