データ分析の流れ🔮
以下のデータを分析することで、Bayeslabの重要な機能を見ていきましょう。
データインポート
まず、このデータをインポートして、データがどのようなものか見てみましょう。

人口統計情報、ユーザー分類、購入統計など、いくつかの列を持つ30k行近くになります。
次へ

Bayeslabは、このテーブルのタイプと説明、および分析に適したものにするための推奨事項を提案しています
「タイプ」と「説明」は、AIが正しくアクションを実行するためにかなり重要です。特に一般的に知られていないような特殊な内容については、正しく、十分な詳細が含まれていることを確認してください。
例えば
ライフサイクルの欄にはA、B、Cのレベルがあります。これらのレベルが何を意味するのか、他に選択肢があるのか明記するとよいでしょう。
性別列は数字で表されており、各数字が何を示すのかを明確にすることが重要です。
このデータはオンライン・サービスのユーザー行動情報であることがわかっているので、このデータセットの性質をよりよく表すために、テーブル名をuser_behaviorに変更します。
次に確認します。

AIで探る
まずはAIがこのデータを分析し、何が得られるか見てみよう:

A,B,Cステージの明確な定義がないこと(今のところ無視)、いくつかの値が欠けていること、そしていくつかの潜在的な関係について言及しています。
知っておいて損はない。
また、下にいくつかの興味深いツールがあります。

自動チャート
新しく追加されたブロックの「自動チャート」と「実行」をクリックして、自動探索を試して見よう。

いくつかの自動分析と分布が行われ、そのチャートを観察して洞察を得たり、チャートの改善方法に関する推奨が行われたりします。
得られた知識はかなりのものです。
分析アイデア
次に、このデータから他に何が得られるかを見てみたい場合、「 Analysis Ideas」 をクリックしてください。

データの必要性、視覚的なもの、目標が説明された興味深いアイデアがいくつかあります。 後でぜひ試してください。
さあ、データを直接扱いましょう。例えば、まずこれらのデータのクリーンアップや変換を行います。経験とは、それを明確にすることです。

結果には「フィルタリングおよび正規化されたデータフレーム」が含まれており、クリックするとデータが私たちの指示に従ってクリーンアップされたことがわかります。
次のブロックでは、この結果を参照して(//を使用して)データをさらに加工し、何をしたいかを伝えることができます。

ここでの結果(最終結果DataFrameのようなもの)は一時的なもので、マシンとの接続を切るとクリアされます。
結果を保存したい場合は、以下のように 「write back 」などと言って結果を書き戻すことができる。

チャート作成
前のステップでAIが推奨している可視化を行って、さらに分析してみよう。
年齢層が収益にどのように影響するかを見てみましょう。

ご覧のように、分析では実際に常識を使ってデータをもう少し推定しています。例えば、0~20歳は「若者」に相当します。
カスタマイズ
タイトルとその位置が良くないので、このチャートにカーソルを合わせて 「Edit 」をクリックすれば変更できます。

詳しくはチャートをご覧ください。
予測
私たちは機械学習を理解していないかもしれないが、それでも予測やwhat-if分析をしたい。

1行で、年齢/性別と過去の注文金額に基づいて収益を予測する予測モデルを構築できます。
次に、もう1行を使って予測を行います。

出力結果におけるR二乗値に特に注意してください。
R²値は、独立変数がどれほど従属変数の分散を説明しているかを測定します。この値は0から1の範囲で示されます。
0: モデルは分散を全く説明していない。
1: モデルは全ての分散を説明している。
したがって、上記のンプルでは、モデルは非常に悪い(R二乗値 = 0.069)ことを意味します。これは、選択した要因が収益と明確な関係を持たないか、他のモデルを試す必要があることを示しています。
シェア
最後に、私たちのチームの誰かがこの分析を見て、もしかしたら自分で質問を投げかけたいかもしれない。

「データテーブルを含む」オプションにチェックを入れ、あなたの友人がすべてを再現し、データでより多くのことができるようにしてください。
最終更新