本帖最后由 rzz8118 于 2020-12-30 15:35 编辑
经常给大家推荐好用的数据分析工具,也收到了铁子们的各种好评。这次也不例外,我要再推荐一个,而且是个爆款神器。 Excel和Jupyter Notebok都是我每天必用的工具,而且两个工具经常协同工作,一直以来工作效率也还算不错。但说实在,毕竟是两个工具,使用的时候肯定会有一些切换的成本。 最近,在逛GitHub突然发现了一款神器「PyXLL-Jupyter」,它可以完美将Jupyter Notebook嵌入到Excel中!是的,你没听错,使用它我们就可在Excel中运行Jupyter Notebook,调用Python函数,实现数据共享。 一、安装首先,想要在Excel中运行Python代码,需要安装PyXLL插件。PyXLL可以将Python集成到Excel中,用Python替代VBA。 先用 pip 安装 PyXLL。 pip install pyxll
然后再用PyXLL独特的命令行工具安装Excel插件。 >> pyxll install
安装好了PyXLL在 Excel中的插件,下一步就是安装pyxll-jupyter软件包了。使用pip安装pyxll-jupyter软件包: pip install pyxll-jupyter
安装完毕后,启动Excel,将在PyXLL选项卡中看到一个新的Jupyter按钮。
单击此按钮可在Excel工作簿的侧面板中打开Jupyter Notebook。该面板是Excel界面的一部分,可以通过拖放操作取消停靠或停靠在其他位置。 在Jupyter面板中,你可以选择一个现有的Notebook或创建一个新的Notebook。创建一个新的Notebook,选择新建按钮,然后选择Python 3。 二、使用方法
这样做有什么用处呢? 1、Excel和Python共享数据比如,我们要将数据从Excel导入Python。由于Excel和Python已经在同一进程中运行了,所以在Python中访问Excel数据以及在Python和Excel之间切换非常快。 更牛X的是,pyxll-jupyter还单独附带了一些IPython魔法函数,输入后一键即可完成同步。 %xl_get将Python中的数据移到Excel,也是同理,非常简单。 无论是使用Python先加载数据集,再传输到Excel,还是其它形式,从Python复制数据到Excel非常容易。 %xl_set
当然,%xl_get和%xl_set都附带参数选项可以自定义导入导出规则。 2. 在Excel中使用Python绘图PyXLL的另一大用处就是它集成了几乎所有主流的可视化包,因此我们可以在Excel中利用这些可视化包随意绘图,包括matplotlib、plotly、bokeh和altair等。%xl_plot
同样,使用魔法函数%xl_plot在Excel中可以绘制任何的Python图。任何一个受支持的可视化包也可进行绘图然后传递图形对象到Excel中,比如上图中使用pandas的绘图效果就很好。 %xl_plot df.plot(kind='scatter')
3. 从Excel调用Python函数使用Excel离不开函数,而当我们需要一些复杂功能时,自带函数未必能满足我们的需求。通过PyXLL,我们可以直接在Excel中调用Python函数,并对其进行实时测试。这就避免了Excel和Jupyter之间的来回切换成本,有点像dataframe的apply用法,写个函数直接与Excel完美融合。 函数写好后,还可将其添加到PyXLL Python项目中。这样以后每次都可以复用实现相同功能,简直不要太香! from pyxll import xl_func
@xl_func
def test_func(a, b, c):
return (a * b) + c
比如,输入以上代码在Jupyter中运行后,Python函数将立即可被Excel工作簿调用。 不只是简单的函数,还可以将整个数据作为pandas的DataFrames传给函数,并返回任何的Python类型,比如numpy array、DataFrames,甚至还可以通过给@xl_func装饰器一个签名字符串来告诉PyXLL输出什么类型。例如,以下函数: from pyxll import xl_func
# 装饰器签名告诉 PyXLL 如何转换函数参数和返回的值
@xl_func("dataframe df: dataframe<index=True>", auto_resize=True)
def df_describe(df):
# df 是一个从数据集里创建的 pandas DataFrame 传递给函数
desc = df.describe()
# desc 是新的 DataFrame(PyXLL转换为一组值并返回给Excel所创建的)
return desc
现在可以编写复杂的Python函数来进行数据转换和分析,但是可以协调在Excel中如何调用或排序这些函数。更改输入会导致调用函数,并且计算出的输出会实时更新,这与我们期望的一样。 |