迫于群友内卷压力,无奈自学
参考:①Python - Data Science Tutorial (tutorialspoint.com)
Preliminary knowledge【预备知识】
Introduction
Examples of Using Data Science
Recommendation System【推荐系统】
捕捉并分析消费者或使用者的购买或使用偏好Finanacial Risk Management【金融风险管理】
通过使用客户过去的消费习惯、过去的违约、其他财务承诺和许多社会经济指标,可以更好地分析涉及贷款和信贷的金融风险。这些数据以不同的格式从不同的来源收集。将它们组织在一起并深入了解客户档案需要数据科学的帮助Improvement in Health Care Services【卫生保健服务的改善】
医疗保健行业处理各种数据,可分为技术数据、财务数据、患者信息、药物信息和法律规则。所有这些数据都需要以协调一致的方式进行分析,以便为保健提供者和保健接受者节省成本,同时保持法律合规Computer Vision【计算机视觉】
通过计算机识别图像的进步涉及处理来自同一类别的多个对象的大量图像数据。
Efficient Management of Energy【有效的能源管理】
随着能源消费需求的激增,能源生产企业需要更有效地管理能源生产和分配的各个阶段。这包括优化生产方法、储存和分配机制以及研究客户的消费模式
Python in Data Science数据科学的编程要求需要一种非常通用但灵活的语言,这种语言可以简单地编写代码,但可以处理高度复杂的数学处理。Python最适合这种需求
已经确立了作为通用计算和科学计算的语言的地位以新添加的形式不断升级,以满足不同的编程需求Python's Features【一些特性】
简单易学跨平台,非常适合在多环境设置中使用快速,它的执行速度比用于数据分析的其他类似语言(如R和MATLAB)快它出色的内存管理能力,特别是垃圾收集能力,使它能够高效地管理大量数据转换、切片、切分和可视化。拥有一个非常庞大且不断更新的库集合有可以直接使用其他语言(如Java或C)的代码的包。这有助于通过使用其他语言的现有代码来优化代码性能,无论何时它会给出更好的结果 Environment Set Up
这个就略了,CSDN那么多,不差俺的一篇 Pandas_More Details===>Python Pandas_Notes
Intro
Pandas是一个开源Python库,使用其强大的数据结构进行高性能数据操作和数据分析。Python with pandas被用于各种学术和商业领域,包括金融、经济、统计、广告、网络分析等。使用Pandas,我们可以完成数据处理和分析的5个典型步骤,不管数据的来源是什么——加载、组织、操作、建模和分析数据 Some Feature
Dataframe object for data manipulation with integrated indexing【Dataframe对象,用于数据操纵并具有集成的索引】Tools for reading and writing data between inmemory data structures and different file format【在内存中数据结构和不同的文件格式之间读写数据的工具】Data alignment and integrated handling of missing data【数据对齐和集成的缺失数据处理】Reshaping and pivoting of data sets【数据的再成型和旋转】Label-based slicing, fancy indexing, and subsetting of large data sets【大数据集的基于标签的分片、索引和子集】Data structure column insertion and deletion【数据结构列的插入和删除】Group by engine allowing split-apply-combine operations on data sets【按引擎分组,允许在数据集上的分离-应用-合并运算操作】Data set merging and joining【数据集的归并和连接】Hierarchical axis indexing to work with high-dimensional data in a lower-dimensional data structure【层级轴索引,以低维数据结构工作在高维数据上】Time Series-Functionality: Data range generation and frequeny conversions, moving window statistics, moving window linear regressions, date shifting and lagging【时间序列-功能:数据范围生成和频率转换,移动窗口统计,移动窗口线性回归,数据转移和滞后】Provides data filtration【提供数据过滤】 Pandas primarily deal with the following three data structures
Series【数列】
Series is usually a one-dimensional homogeneous array【通常是一维齐次数组】Dataframe【数据帧】
Dataframe is usually two-dimensional with potentially heterogeneously typed columns【通常是二维的,具有潜在的异构类型列】Panel【面板】
Panels are generally three-dimensional labeled arrays 【通常是三维标记阵列】 Numpy_More Details ==>Python NumPy_Notes Scipy Matplotlib



