2,turicreate入门

turicreate入门系列文章目录

1,turicreate入门 - jupyter & turicreate安装

2,turicreate入门 - 一个简单的回归模型

3,turicreate入门 - 优化回归模型,使得预测更准确

0,上传准备好的数据文件

2,turicreate入门

fang_data2.csv

1,导入模块

import turicreate as tc

2,加载数据

sf = tc.SFrame('fang_data.csv')

可能遇到文件编码格式错误,使用文本编辑工具如notepad++将文件格式转换为utf-8即可。

2,turicreate入门

 3,浏览数据

2,turicreate入门

 4,查看区域-价格基本关系

tc.visualization.box_plot(sf['zone'], sf['price'],'区域','价格','区域-价格概况')

2,turicreate入门

 5,面积-租赁价格散点图

tc.visualization.scatter(sf['area'], sf['price'], xlabel='面积', ylabel='租赁价格')

2,turicreate入门

6,基于面积-价格的简单预测模型

1)建立训练数据和测试数据集

train_data, test_data = sf.random_split(.8,seed=0)

2)建立模型

area_price_model = tc.linear_regression.create(train_data,target='price',features=['area'])

3)使用matplotlib展示

%matplotlib inline
import matplotlib.pyplot as plt
plt.plot(test_data['area'],test_data['price'],'.',
        test_data['area'],area_price_model.predict(test_data),'-')

2,turicreate入门