用户指南 Statsmodels 0 14 4 Statsmodels 文档

Leo Migdal
-
用户指南 statsmodels 0 14 4 statsmodels 文档

statsmodels 是一个 Python 模块,提供用于估计各种统计模型的类和函数,以及用于进行统计检验和统计数据探索的类和函数。每个估计器都提供广泛的统计结果列表。结果经过测试,与现有的统计包进行比较,以确保其正确性。该包是在开源的 Modified BSD (3-clause) 许可下发布的。在线文档托管在 statsmodels.org。 statsmodels 支持使用 R 风格公式和 pandas DataFrame 来指定模型。以下是一个使用普通最小二乘法的简单示例 查看 dir(results) 以查看可用的结果。属性在 results.__doc__ 中描述,结果方法有自己的文档字符串。 Seabold, Skipper 和 Josef Perktold。 "statsmodels:Python 的计量经济学和统计建模。” 第九届 Python in Science 大会论文集。 2010 年。 使用 Huber 提案 2 缩放和 'H3' 协方差矩阵的 Andrew's Wave 范数 有关更多选项,请参见 help(sm.RLM.fit),有关比例选项,请参见 module sm.robust.scale

这个非常简单的案例研究旨在帮助您快速上手使用 statsmodels。从原始数据开始,我们将展示估计统计模型和绘制诊断图所需的步骤。我们只使用 statsmodels 或其 pandas 和 patsy 依赖项提供的函数。 pandas 基于 numpy 数组提供丰富的 数据结构和数据分析工具。 pandas.DataFrame 函数提供标记的 (可能异构的) 数据数组,类似于 R 的“data.frame”。pandas.read_csv 函数可用于将逗号分隔值文件转换为 DataFrame 对象。 patsy 是一个 Python 库,用于描述统计模型和使用类似于 R 的公式构建设计矩阵。 本示例使用 API 接口。有关导入 API 接口 (statsmodels.api 和 statsmodels.tsa.api) 与直接从定义模型的模块导入之间的区别,请参见导入路径和结构。 我们下载了Guerry 数据集,这是一个用于支持 Andre-Michel Guerry 1833 年的《法国道德统计学论文》的历史数据集合。该数据集以逗号分隔值格式 (CSV) 形式托管在Rdatasets 存储库中。我们可以将文件下载到本地,然后使用 read_csv 加载它,但是 pandas 会自动为我们完成所有这些操作 statsmodels 提供数据集(即数据 *和* 元数据)供在示例、教程、模型测试等中使用。

该 Rdatasets 项目 提供对 R 的核心数据集包以及许多其他常用 R 包中可用数据集的访问。所有这些数据集都可通过使用 get_rdataset 函数供 statsmodels 使用。实际数据可通过 data 属性访问。例如 get_rdataset(dataname[, package, cache]) 该 Dataset 对象遵循 bunch 模式。完整数据集可在 data 属性中获得。 如果数据集没有对什么是 endog 和 exog 的明确解释,那么您始终可以访问 data 或 raw_data 属性。这适用于 macrodata 数据集,它是一组美国宏观经济数据,而不是具有特定示例的特定数据集。 data 属性包含完整数据集的记录数组,raw_data 属性包含一个 ndarray,其中列的名称由 names 属性给出。 This very simple case-study is designed to get you up-and-running quickly with statsmodels. Starting from raw data, we will show the steps needed to estimate a statistical model and to draw a diagnostic plot.

We will only use functions provided by statsmodels or its pandas and patsy dependencies. After installing statsmodels and its dependencies, we load a few modules and functions: pandas builds on numpy arrays to provide rich data structures and data analysis tools. The pandas.DataFrame function provides labelled arrays of (potentially heterogenous) data, similar to the R “data.frame”. The pandas.read_csv function can be used to convert a comma-separated values file to a DataFrame object. patsy is a Python library for describing statistical models and building Design Matrices using R-like formulas.

This example uses the API interface. See Import Paths and Structure for information on the difference between importing the API interfaces (statsmodels.api and statsmodels.tsa.api) and directly importing from the module that defines the model. 本节收集了各种统计检验和工具。一些可以独立于任何模型使用,一些则旨在作为模型和模型结果的扩展。 API 警告:此类别中的函数和对象分散在各个模块中,并且可能仍在移动。我们预计将来统计测试将返回具有更多信息报告的类实例,而不仅仅是原始数字。 robust_kurtosis(y[, axis, ab, dg, excess]) acorr_breusch_godfrey(res[, nlags, store])

acorr_ljungbox(x[, lags, boxpierce, ...]) 对于希望快速上手使用statsmodels的新用户来说,示例是非常宝贵的,对于希望探索statsmodels新功能的用户来说,它们也非常有用。我们希望为尽可能多的模型和用例提供文档和教程!请考虑在提交任何引入新功能的PR时,附带一个示例。 用户贡献的示例/教程/配方可以放在 statsmodels示例维基页面 该维基页面是自由可编辑的。请将您的酷炫技巧、示例和配方发布在那里! 如果你希望你的示例文件被正式接受并发布到statsmodels的官方网站上,你需要通过正常的补丁提交流程,并遵循后续的指示。 示例最好以 Jupyter Notebook 的形式贡献。将您的笔记本保存为所有输出单元格已清除的 examples/notebooks。 我们有一个示例笔记本画廊,可在此处查看:here。如果您希望您的示例出现在此画廊中,请在docs/source/examples/landing.yml中添加笔记本的链接。对于缩略图,请截取您认为最适合作为笔记本“钩子”的部分的截图。图像将以360 x 225(宽 x 高)的尺寸显示。最好将图像保存为PNG格式,分辨率为360 x 225的倍数(首选720 x 450)。

statsmodels.api: 横截面模型和方法。通常使用 import statsmodels.api as sm 导入。 statsmodels.tsa.api: 时间序列模型和方法。通常使用 import statsmodels.tsa.api as tsa 导入。 statsmodels.formula.api: 用于使用公式字符串和 DataFrame 指定模型的便捷接口。此 API 直接公开支持公式 API 的模型的 from_formula 类方法。通常使用 import statsmodels.formula.api as smf 导入 API 重点关注模型以及最常用的统计检验和工具。 导入路径和结构 解释了这两个 API 模块的设计以及如何从 API 导入与直接从定义模型的模块导入的不同之处。有关可用模型、统计信息和工具的完整列表,请参阅 用户指南 中的详细主题页面。 WLS(endog, exog[, weights, missing, hasconst])

People Also Search

Statsmodels 是一个 Python 模块,提供用于估计各种统计模型的类和函数,以及用于进行统计检验和统计数据探索的类和函数。每个估计器都提供广泛的统计结果列表。结果经过测试,与现有的统计包进行比较,以确保其正确性。该包是在开源的 Modified BSD (3-clause) 许可下发布的。在线文档托管在 Statsmodels.org。 Statsmodels

statsmodels 是一个 Python 模块,提供用于估计各种统计模型的类和函数,以及用于进行统计检验和统计数据探索的类和函数。每个估计器都提供广泛的统计结果列表。结果经过测试,与现有的统计包进行比较,以确保其正确性。该包是在开源的 Modified BSD (3-clause) 许可下发布的。在线文档托管在 statsmodels.org。 statsmodels 支持使用 R 风格公式和 pandas DataFrame 来指定模型。以下是一个使用普通最小二乘法的简单示例 查看 dir(results) 以查看可用的结果。属性在 results.__doc__ 中描述,结果方法有自己的文档字符串。 Seabold, Skipper 和 Josef Perktold。 "statsmodels:Python 的计量经济学和统计建模。” 第九届 Python in Science 大...

这个非常简单的案例研究旨在帮助您快速上手使用 Statsmodels。从原始数据开始,我们将展示估计统计模型和绘制诊断图所需的步骤。我们只使用 Statsmodels 或其 Pandas 和 Patsy 依赖项提供的函数。 Pandas 基于

这个非常简单的案例研究旨在帮助您快速上手使用 statsmodels。从原始数据开始,我们将展示估计统计模型和绘制诊断图所需的步骤。我们只使用 statsmodels 或其 pandas 和 patsy 依赖项提供的函数。 pandas 基于 numpy 数组提供丰富的 数据结构和数据分析工具。 pandas.DataFrame 函数提供标记的 (可能异构的) 数据数组,类似于 R 的“data.frame”。pandas.read_csv 函数可用于将逗号分隔值文件转换为 DataFrame 对象。 patsy 是一个 Python 库,用于描述统计模型和使用类似于 R 的公式构建设计矩阵。 本示例使用 API 接口。有关导入 API 接口 (statsmodels.api 和 statsmodels.tsa.api) 与直接从定义模型的模块导入之间的区别,请参见导入路径和结构。 我们下...

该 Rdatasets 项目 提供对 R 的核心数据集包以及许多其他常用 R 包中可用数据集的访问。所有这些数据集都可通过使用 Get_rdataset 函数供

该 Rdatasets 项目 提供对 R 的核心数据集包以及许多其他常用 R 包中可用数据集的访问。所有这些数据集都可通过使用 get_rdataset 函数供 statsmodels 使用。实际数据可通过 data 属性访问。例如 get_rdataset(dataname[, package, cache]) 该 Dataset 对象遵循 bunch 模式。完整数据集可在 data 属性中获得。 如果数据集没有对什么是 endog 和 exog 的明确解释,那么您始终可以访问 data 或 raw_data 属性。这适用于 macrodata 数据集,它是一组美国宏观经济数据,而不是具有特定示例的特定数据集。 data 属性包含完整数据集的记录数组,raw_data 属性包含一个 ndarray,其中列的名称由 names 属性给出。 This very simple case-stu...

We Will Only Use Functions Provided By Statsmodels Or Its

We will only use functions provided by statsmodels or its pandas and patsy dependencies. After installing statsmodels and its dependencies, we load a few modules and functions: pandas builds on numpy arrays to provide rich data structures and data analysis tools. The pandas.DataFrame function provides labelled arrays of (potentially heterogenous) data, similar to the R “data.frame”. The pandas.rea...

This Example Uses The API Interface. See Import Paths And

This example uses the API interface. See Import Paths and Structure for information on the difference between importing the API interfaces (statsmodels.api and statsmodels.tsa.api) and directly importing from the module that defines the model. 本节收集了各种统计检验和工具。一些可以独立于任何模型使用,一些则旨在作为模型和模型结果的扩展。 API 警告:此类别中的函数和对象分散在各个模块中,并且可能仍在移动。我们预计将来统计测试将返回具有更多信息报告的类实例,而不仅仅是原始数字。 robust_kurtosis(y[, axis, ab, dg, ex...