データサイエンス100本ノックをやってみた【その2:R編】

『データサイエンス100本ノック(構造データ加工編)』をやってみた感想記事の2回目、R編です。

 その1:SQL編の感想はこちら。

  • 主な内容
  • 印象に残った設問たち 
    • 基本統計量の算出
    • tidyrでの縦持ち/横持ち変換
    • 日付の操作
    • ダミー変数を作る
    • データをTrain/Testを分割
  • 感想
続きを読む

Tableau DATA Saber 認定制度の振り返り

2020年4月〜6月の3ヶ月間、Tableau DATA Saber 認定制度に挑戦していました。*1

先日、無事にDATA Saberに認定されましたので、本記事では90日間の振り返りや、新しい挑戦者に向けた宣伝をやってみようかと思います。

  • DATA Saber 認定制度
    • 要するになんなの?
    • 「何を」示す称号なのか?
    • 参加資格
  • 始めたきっかけ
    • 建前
    • 本音
  • 90日間なにやってたの?
    • Ordinal(課題)を解く
    • 社内でTableauを使う
    • 社外でTableauを使う
    • Tableau / Data Visualizationへの知見を広げる
    • 最終試験を受ける
    • 二つ名を考える
  • 学んだこと
    • Tableauの基本的な操作スキル
    • "ビジュアライズ"に対する意識の持ち方
    • これから業務で起こるであろうことへの心構え
  • これからどうするの?
    • お仕事で楽がしたい
    • 社内に味方が欲しい
    • ”業務”以外のチャンネルを開き続けていたい
  • Apparentice, 募集しています
  • おまけ:ちゃんとした方による体験記

*1:昔は”JEDI”と呼ばれていたものだといえば、多少は噂を聞いたことがあるかもしれません。

続きを読む

データサイエンス100本ノックをやってみた【その1:SQL編】

2週間ほど前に公開された『データサイエンス100本ノック(構造データ加工編)』を、仕事終わりに少しずつ進めていました。 

github.com

 

(構造データ加工編)という名前からわかるように、中身は『データ前処理100本ノック』です。『前処理大全』対応問題集みたいな感じですよね。

 SQL, R, Pythonで各100問ずつなので、合計300問が解答付きで公開されています。ありがたやありがたや。新卒入社してデータ分析始めた頃にこういうコンテンツが欲しかったです…!

ということで、SQL編を一通りやってみたので感想記事です。*1

  • 環境設定
  • 主な内容
  • 印象に残った設問たち 
  • 感想

*1:わかんなかったところはすぐに解答見て写経した

続きを読む

【ざっくり感想】『データ視覚化のデザイン』

Tableu界隈で数ヶ月前から話題になっていた『データ視覚化のデザイン』を読みました。*1

Amazonでも早速ランキング上位に入り込んでいるらしいですね。

データ視覚化のデザイン

データ視覚化のデザイン

 
  • 何が書いてあるの?
  • 誰が読むといいの?
  • ざっくり各章レビュー
    • 第1章:データ視覚化「キモのキモ」
    • 第2章:これだけでグッとプロっぽくなるコツ
    • 第3章:目的に応じたチャートの選択
    • 第4章:事例で学ぶ -ダッシュボード作成過程 思考キャプション-
    • 第5章:本当に組織に根付かせるために
  • 似たような本と比較してみる
    • 『ノンデザイナーズ・デザインブック』より、人を動かす場面を想定している
    • Google流資料作成術』より、データ分析”文化”を変えようとしている 
  • 気をつけたほうがいいところ
  • おわりに

*1:Data saberの最終試験前にギリギリ間に合ってよかったです…!

続きを読む

読んだ本(2020年4〜5月)

半月ほど遅れですが、2020年4〜5月に読んだ本から一部抜粋。

実質、この何倍かのなろう系小説を読んでましたが、挙げたらキリが無いので対象外です*1

*1:なろう系と言いつつカクヨム派です。

続きを読む

【Tableau】サンプル−スーパーストアで『実践 顧客起点マーケティング』【Data Saber Apprentice】

この記事は Tableau DATA Saber Apprenticeのコミュニティポイント稼ぎの記事です。

 

2019年のマーケティング業界で最も話題になった本の一つに、元スマートニュース西口さんの『実践 顧客起点マーケティング』が挙げられるかと思います。

私はマーケティングリサーチ業界の隅っこで細々と生きているのですが、本書にインスパイアされた分析依頼をこの1年で何度か目にしました。なかには本書を「赤本」と呼んでいる方々もいらっしゃったくらいです*1

ということで、今回は本書に紹介されていた『5セグマップ』というフレームワークを、Tableauユーザーみんなが大好きサンプル−スーパーストアで試してみようという企画です。

  • 『5セグマップ』って?
  • 主役とライバルを決めよう
  • セグメント定義を決める
    • ロイヤル顧客:認知あり/購入頻度 高
    • 一般顧客:認知あり/購入頻度中〜低
    • 離反顧客:認知あり/購入経験あり/現在購入なし
    • 認知、未購入顧客:認知あり/購入経験なし
    • 未認知顧客:認知なし
  • サンプル−スーパーストアで『5セグマップ』を作る
  • できあがり
  • オーバーラップ分析
  • もうすこし、購買データを使って『5セグマップ』
    • セグメント別の過去購買傾向
    • セグメント別の競合メーカー探索 
  • まとめ
    • Tableauでやるメリット
    • Tableauでやるデメリット

*1:打ち合わせが『赤本のp.29によると〜』って進むんですが、Kindkeで購入したので幾度となく話に置いていかれました…

続きを読む

【Tableau】ビデオリサーチの視聴率ランキングを勝手にTableauで再現する【Data Saber Apprentice】

この記事は Tableau DATA Saber Apprenticeのコミュニティポイント稼ぎの記事です。

 

視聴率ってありますよね。ビデオリサーチさんが提供しているアレです。そして何よりテレビ局はじめ業界では”通貨”として使われている、非常に重要なデータです。

そんなビデオリサーチさん、ホームページ上にて週間視聴率ランキングを公開しています。

www.videor.co.jp

このランキング、見ている分にはそれなりに楽しいのですが、もっと期間やジャンル・エリアを操作できるなど、動的なインタラクションが欲しくなるのもまたあるかと思います。特に期間は、過去分や区切り方を変えたデータも簡単に出力できるとすっごく楽しいですよね。

ということで、今回は上記コンテンツをTableau上で再現してみようという試みです*1

  • そもそも、どんなデータなのか?
  • ダッシュボード用のダミーデータを用意する
  • 番組ごとの最大視聴率を判定してみる
  • ランキングを作成してみる
  • まとめ

*1:もちろん、当然のことながら私とビデオリサーチには何の関係もございません。新卒採用で落ちたのが人生最大の接点です。

続きを読む