原文:http://pandas.pydata.org/pandas-docs/stable/remote_data.html
校对:(虚位以待)
删除子包pandas.io.data
以支持可单独安装的pandas-datareader包。这将允许数据模块独立更新到您的pandas安装。pandas-datareader v0.1.1
的API与pandas v0 .16.1
。(GH8961)
您应该替换以下的导入:
from pandas.io import data, wb使用:
from pandas_datareader import data, wb
ga
模块为Google Analytics API提供了一个包装,以简化检索流量数据。结果集将解析为具有从源表派生的形状和数据类型的pandas DataFrame。
您需要做的第一件事是设置对Google Analytics(分析)API的访问。请按照以下步骤操作:
client_secrets.json
pandas/io
模块目录第一次使用read_ga()
函数时,将打开一个浏览器窗口,要求您对Google API进行身份验证。请继续。
以下内容将从特定媒体资源获取2014年第一季度每周的每日用户和浏览量(指标)数据。
import pandas.io.ga as ga
ga.read_ga(
account_id = "2360420",
profile_id = "19462946",
property_id = "UA-2360420-5",
metrics = ['users', 'pageviews'],
dimensions = ['dayOfWeek'],
start_date = "2014-01-01",
end_date = "2014-08-01",
index_col = 0,
filters = "pagePath=~aboutus;ga:country==France",
)
唯一的强制参数是metrics,
dimensions
和start_date
。我们强烈建议您始终指定account_id
,profile_id
和property_id
,以避免在Google Analytics(分析)中访问错误的数据桶。
index_col
参数指示必须将哪个维度用作索引。
filters
参数指示要应用于查询的过滤。在上面的示例中,网页网址必须包含aboutus
,访问者国家必须是法国。
详细信息如下: