データ分析の流れ🔮

以下のデータを分析することで、Bayeslabの重要な機能を見ていきましょう。

852KB
開く
サンプル・データ・ファイル

データインポート

まず、このデータをインポートして、データがどのようなものか見てみましょう。

人口統計情報、ユーザー分類、購入統計など、いくつかの列を持つ30k行近くになります。

次へ

Bayeslabは、このテーブルのタイプと説明、および分析に適したものにするための推奨事項を提案しています

このデータはオンライン・サービスのユーザー行動情報であることがわかっているので、このデータセットの性質をよりよく表すために、テーブル名をuser_behaviorに変更します。

次に確認します。

データテーブルのプレビュー

AIで探る

まずはAIがこのデータを分析し、何が得られるか見てみよう:

AIによるデータ分析

A,B,Cステージの明確な定義がないこと(今のところ無視)、いくつかの値が欠けていること、そしていくつかの潜在的な関係について言及しています。

知っておいて損はない。

また、下にいくつかの興味深いツールがあります。

自動チャート

新しく追加されたブロックの「自動チャート」と「実行」をクリックして、自動探索を試して見よう。

自動チャート作成結果の一部

いくつかの自動分析と分布が行われ、そのチャートを観察して洞察を得たり、チャートの改善方法に関する推奨が行われたりします。

得られた知識はかなりのものです。

分析アイデア

次に、このデータから他に何が得られるかを見てみたい場合、「 Analysis Ideas」 をクリックしてください。

データの必要性、視覚的なもの、目標が説明された興味深いアイデアがいくつかあります。 後でぜひ試してください。

さあ、データを直接扱いましょう。例えば、まずこれらのデータのクリーンアップや変換を行います。経験とは、それを明確にすることです。

シンプル・クリーニング

結果には「フィルタリングおよび正規化されたデータフレーム」が含まれており、クリックするとデータが私たちの指示に従ってクリーンアップされたことがわかります。

次のブロックでは、この結果を参照して(//を使用して)データをさらに加工し、何をしたいかを伝えることができます。

2nd トランスフォーメーション ブロック
書き戻し

チャート作成

前のステップでAIが推奨している可視化を行って、さらに分析してみよう。

年齢層が収益にどのように影響するかを見てみましょう。

ご覧のように、分析では実際に常識を使ってデータをもう少し推定しています。例えば、0~20歳は「若者」に相当します。

このチャートとチャットを続け、より良い助けになるように、より多くのコンテキストを提供することができます。

例えば、これらの収益はどのような製品を表しているのかを説明すると、10歳の高い支出を説明するのに役立ちます。( あるいは、年齢が偏っているか、「年齢 」が 「年 」を意味しないのかもしれない)。

カスタマイズ

タイトルとその位置が良くないので、このチャートにカーソルを合わせて 「Edit 」をクリックすれば変更できます。

詳しくはチャートをご覧ください。

予測

私たちは機械学習を理解していないかもしれないが、それでも予測やwhat-if分析をしたい。

1行で、年齢/性別と過去の注文金額に基づいて収益を予測する予測モデルを構築できます。

次に、もう1行を使って予測を行います。

シェア

最後に、私たちのチームの誰かがこの分析を見て、もしかしたら自分で質問を投げかけたいかもしれない。

「データテーブルを含む」オプションにチェックを入れ、あなたの友人がすべてを再現し、データでより多くのことができるようにしてください。

最終更新