第3部分 数据处理与绘图

数据处理部分,我们用工具和Python基础稍有一点不同。

Python基础部分,我们一直在某一个.py文件上工作。 .py文件是Python的源代码文件,或者说脚本文件, 这个文件本身可以由Python的解释器进行从头到尾的执行(也是最基本的执行方式,见第一部分的第2章“Python程序的执行”)。 也可以在VSCODE中,按Cell执行来进行互动执行(运行一部分代码,看一部结果)。

对于分析类的工作,显然互动执行更加方便,正如我们的两次大作业。

在数据分析的场合,我们还可以使用Notebook方式工作。

新建一个文件,保存为.ipynb,比如001.ipynb,VSCODE就会启动Jupyter Notebook模式。

这个模式的特点是

  1. 每个cell运行的结果,会直接显示在这个cell的下方。
  2. 只有互动运行方式,不能在外部使用Python解释器运行。

注意:

vscdoe(默认情况下)只看扩展名来区分两者: 文件名是.py结尾,你就是在编辑一个python的源代码文件; 文件名是.ipynb结尾,你就是在编辑一个Jupyter Notebook文件。

绝大部分情况下,两者都可以完成分析类的工作。

  1. 如果你要cell的运行结果显示在cell下方, 你就选择Jupyter Notebook。

  2. 如果你希望这个文件中的代码可以被其他程序(另一个.py文件,或者Jupyter Notebook)调用,选择.py文件。

实践中,往往会在Jupyter Notebook(.ipynb文件)中进行分析工作, 在.py文件中写模块(某些常用函数等),然后在Noteboook中import。后续我们会采用这种方式,但从数据分析的过程来看,两者没有本质的区别。