第3部分 数据处理与绘图
数据处理部分,我们用工具和Python基础稍有一点不同。
Python基础部分,我们一直在某一个.py
文件上工作。 .py
文件是Python的源代码文件,或者说脚本文件, 这个文件本身可以由Python的解释器进行从头到尾的执行(也是最基本的执行方式,见第一部分的第2章“Python程序的执行”)。 也可以在VSCODE中,按Cell执行来进行互动执行(运行一部分代码,看一部结果)。
对于分析类的工作,显然互动执行更加方便,正如我们的两次大作业。
在数据分析的场合,我们还可以使用Notebook方式工作。
新建一个文件,保存为.ipynb
,比如001.ipynb
,VSCODE就会启动Jupyter Notebook模式。
这个模式的特点是
- 每个cell运行的结果,会直接显示在这个cell的下方。
- 只有互动运行方式,不能在外部使用Python解释器运行。
注意:
vscdoe(默认情况下)只看扩展名来区分两者: 文件名是.py
结尾,你就是在编辑一个python的源代码文件; 文件名是.ipynb
结尾,你就是在编辑一个Jupyter Notebook文件。
绝大部分情况下,两者都可以完成分析类的工作。
如果你要cell的运行结果显示在cell下方, 你就选择Jupyter Notebook。
如果你希望这个文件中的代码可以被其他程序(另一个
.py
文件,或者Jupyter Notebook)调用,选择.py
文件。
实践中,往往会在Jupyter Notebook(.ipynb
文件)中进行分析工作, 在.py
文件中写模块(某些常用函数等),然后在Noteboook中import
。后续我们会采用这种方式,但从数据分析的过程来看,两者没有本质的区别。