こんにちは、セルゲイ・カチンスキーです。
皆さんは豆乳を飲んでいますか?
とにかく味の種類が多く、どれもめちゃくちゃ美味しい……
数か月に一度新しい味のラインナップも追加されるので飽きることなく楽しむことができます。
そして僕は豆乳を飲むたびに必ずあることをやっています。ツイートです。
2019年から欠かさず豆乳を飲んだ時は「○○味の豆乳おいしい」という定型文をリアルタイムでツイートしています。こうすることで何味をいつ飲んだか振り返ることができるのでとても楽しいです。
豆乳おいしいツイートを3年半続けてきて累計で何回豆乳を飲んできたのか数えようと思ったのですが、Twitter内の検索では件数は出力されず、一つ一つ数えるのも面倒です。
そこで、自分のTwitterデータをエクセルに出力できれば、いつ、何味の豆乳を、何回飲んだのかまで分析できて楽しいのではと思いました。やってみましょう。
1.自分のTwitterのログデータをダウンロードする
知らない人も多いかもしれませんが、自分がTwitterに投稿したツイートのデータはダウンロードすることができます。ツイートした文章データだけではなく、投稿した画像なども自分のPCに保存することができるので一度やっておくことをおすすめします。これでいつTwitterが閉鎖になっても安心ですね。
具体的な方法はTwitter公式のヘルプページをご覧ください。
ダウンロードリクエスト後、Twitter側でデータ保護操作をやるらしく実際にダウンロードできるまで時間がかかるので気長に待ってください。
.zipファイルを開くと「data」フォルダの中の「tweet」というデカめの容量のJavaScriptファイルがあり、ここに自分のツイートデータが保存されています。
visual studio codeや Pythonに詳しい人ならこれでいろいろ試せるみたいです。
ちなみにこの「Your archive」というhtmlファイルを開くと、ダウンロードしたローカルデータを読み込んでPC版Twitterに似たブラウザが立ち上がります。インターネットが繋がらない状況でも自分のツイートログを眺めていたいという特殊な状況で役立ちます。
2.JavaScriptファイルをCSVファイルに変換する
ダウンロードしたJavaScriptファイルをvisual studio codeとかいうので一応開いて確認してみます。(visual studio codeが入ってない場合も今回は使わないので不要です。)
自分のツイートが多いとデータも大きくなりデータ行数が多くなります。僕のは50万行ありました。多すぎ。
みなさんもエッチティーエムエルのやつのプログラミングのやつはよくわからんの思うので、比較的操作しやすいであろうエクセルにデータ出力していきます。
ログデータはJavaScript形式なのでこれをCSVファイルに変換します。
変換が一筋縄ではいかないっぽいのですが、調べたところインターネットの先人たちが作った簡単な変換ツールがありました。ありがとう、有能謎個人ブログ……
(全てブラウザ上だけで変換してるっぽいですが一応注意事項をよく読んでから使ってください。)
マジで一瞬で変換できたぜ。
3.エクセルで特定ワードのツイートを抽出、グラフ化
ダウンロードしたCSVファイルをエクセルで開きます。
漏れのアニメ実況ツイートもエクセル上ではこんな感じになるぜ。
自分はTwitter初めて4年弱で約1万ツイート、つまりデータが1万行入っているので結構動作が重くなります。Twitter歴10年、累計10万ツイートとかいうTwitter廃人のエクセルでも動くかはマジで知らん。
ありがたいことにツイート内容に紐付いた投稿日時、いいね、RT数もばっちり保存されているのでいろいろ使い勝手の良いデータになっていると思います。
ここから本題の「豆乳おいしい」ツイートのみを抽出していく作業です。
まず、空いているF2セルに「C列のツイート内容に”豆乳おいしい”という単語が入っていれば、F列に”○”を表示させる」関数を入れます。
=IF(COUNTIF(C2,"*豆乳おいしい*")>=1,"○","")
当然”豆乳おいしい”の部分を任意のワードに変えると応用が利くので皆さんもいろいろ試してみてください。
この関数をF列全部にオートフィルしていくわけですが1万行あるのでアホみたいにドラッグして下まで引っ張ってたら終わりません。関数の入ったセルの右下にカーソルを合わせると+マークが出て、そこでダブルクリックをするとデータのある一番下まで自動でオートフィルしてくれるという小技があります。みんな賢くなったな。*1
こんな感じで”豆乳おいしい”ツイートの欄だけに○が表示されます。ここまでくれば簡単です。
キタ━━━━━━━━!!豆乳おいしいツイートだけ綺麗にソートすることができました。
エクセルがクッソ重くなってきたので必要なソート部分だけセルコピーして別シートに貼っつけますわ。(お嬢様)
そして「豆乳おいしい」ツイート数を
=COUNTA(C2:C84)
「豆乳おいしい」ツイートの種類、つまり飲んできた豆乳の味の種類を
=SUMPRODUCT(1/COUNTIF(C2:C84,C2:C84))
で計算します。
結果は……
豆乳を飲んだ回数:83回、飲んできた豆乳の種類:46種類という結果でした。
1本200mlなので16.6Lも飲んだのか……
豆乳40種類以上味出てんの!?キッコーマンさんの商品開発力すごすぎ。
調”整”豆乳と調”製”豆乳などで表記ブレ(正しくは調製豆乳)しているツイートもありましたがそれでも40種類以上です。
キッコーマンの豆乳にはこの世の全ての味という味が存在している。
月ごとの豆乳ツイート数をピボットグラフでいい感じするとこんな感じです。
豆乳を買い始めた初期にいろんな味をコンプするために飲みまくり、その後飽きてペースが落ち、20年9月に謎の再ブームが自分のなかで来ているな。それからは月に数本ペースで飲み続けていました。
これからも豆乳を飲んで、ツイートしていこうと思います。
キッコーマンさん!!見ていますか!?
案件お待ちしております。
みなさんも自分のTwitterのデータをエクセルに出力して良い感じにしてみてください。
楽しいと思います。
終わり
*1:僕は今知りましたが……