<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Pip on Python数据分析</title><link>https://www.pythondataanalysis.com/tags/pip/</link><description>Recent content in Pip on Python数据分析</description><generator>Hugo</generator><language>zh-CN</language><copyright>[jqx](https://jqx.me)</copyright><lastBuildDate>Mon, 14 Jul 2025 16:04:40 +0800</lastBuildDate><atom:link href="https://www.pythondataanalysis.com/tags/pip/index.xml" rel="self" type="application/rss+xml"/><item><title>Polars与pandas差异对比</title><link>https://www.pythondataanalysis.com/posts/polars-vs-pandas/</link><pubDate>Tue, 15 Apr 2025 12:20:29 +0800</pubDate><guid>https://www.pythondataanalysis.com/posts/polars-vs-pandas/</guid><description>&lt;p&gt;如果您有关注过去一年中 Python DataFrame 的进展，那么您一定听说过 Polars，专为处理大型数据集而设计的强大 DataFrame 库。&lt;/p&gt;
&lt;p&gt;&lt;img src="https://blog.jetbrains.com/wp-content/uploads/2023/08/Preview-page-1280x720-2x-1.jpg" alt="Preview-page" /&gt;&lt;/p&gt;
&lt;p&gt;与 Spark、Dask 和 Ray 等处理大型数据集的其他库有所不同，Polars 在单台机器上使用，也因此引起许多与 pandas 的比较。 事实上，Polars 在许多重要方面都与 pandas 存在差异，包括数据处理方式以及最佳应用。 下文将探讨这两种 DataFrame 库的技术细节区别，并分析其各自优点和局限。&lt;/p&gt;
&lt;p&gt;如果您想听 Polars 的缔造者 Ritchie Vink 亲口讲述，您可以在此处找到我们对他的采访！&lt;/p&gt;
&lt;h2 id="为什么使用-polars-而不是-pandas"&gt;为什么使用 Polars 而不是 pandas？&lt;a class="anchor" href="#%e4%b8%ba%e4%bb%80%e4%b9%88%e4%bd%bf%e7%94%a8-polars-%e8%80%8c%e4%b8%8d%e6%98%af-pandas"&gt;#&lt;/a&gt;&lt;/h2&gt;
&lt;p&gt;两个字：性能。 Polars 从一开始就速度极快，执行常见运算的速度是 pandas 的 5 到 10 倍。 另外，Polars 运算的内存需求明显小于 pandas：pandas 需要数据集大小的 5 到 10 倍左右的 RAM 来执行运算，而 Polars 需要 2 到 4 倍。&lt;/p&gt;
&lt;p&gt;您可以在这里了解 Polars 与其他 DataFrame 库的性能对比。 对于常见运算，Polars 的速度是 pandas 的 10 到 100 倍，也是最快的 DataFrame 库之一。 此外，在内存不足错误之前，它可以处理比 pandas 更大的数据集。&lt;/p&gt;</description></item><item><title>使用Python批量检测URL状态码</title><link>https://www.pythondataanalysis.com/posts/Use-Python-to-detect-URL-status-codes-in-batches/</link><pubDate>Fri, 10 Nov 2023 12:20:29 +0800</pubDate><guid>https://www.pythondataanalysis.com/posts/Use-Python-to-detect-URL-status-codes-in-batches/</guid><description>&lt;p&gt;想要找到3位长度的github ID，可以对用户页URL进行探测，找到所有不可用的就有可能没有注册。&lt;/p&gt;
&lt;p&gt;使用python很简单能实现以上需求。&lt;/p&gt;
&lt;p&gt;首先安装&lt;code&gt;pip requests&lt;/code&gt;&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#e2e4e5;background-color:#282a36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-python" data-lang="python"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#ff6ac1"&gt;import&lt;/span&gt; requests
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;&lt;span style="color:#ff6ac1"&gt;for&lt;/span&gt; x1 &lt;span style="color:#ff6ac1"&gt;in&lt;/span&gt; &lt;span style="color:#ff5c57"&gt;range&lt;/span&gt;(&lt;span style="color:#ff9f43"&gt;97&lt;/span&gt;,&lt;span style="color:#ff9f43"&gt;123&lt;/span&gt;): 
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; &lt;span style="color:#ff6ac1"&gt;for&lt;/span&gt; x2 &lt;span style="color:#ff6ac1"&gt;in&lt;/span&gt; &lt;span style="color:#ff5c57"&gt;range&lt;/span&gt;(&lt;span style="color:#ff9f43"&gt;97&lt;/span&gt;,&lt;span style="color:#ff9f43"&gt;123&lt;/span&gt;):
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; &lt;span style="color:#ff6ac1"&gt;for&lt;/span&gt; x3 &lt;span style="color:#ff6ac1"&gt;in&lt;/span&gt; &lt;span style="color:#ff5c57"&gt;range&lt;/span&gt;(&lt;span style="color:#ff9f43"&gt;97&lt;/span&gt;,&lt;span style="color:#ff9f43"&gt;123&lt;/span&gt;):
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; url&lt;span style="color:#ff6ac1"&gt;=&lt;/span&gt;&lt;span style="color:#5af78e"&gt;&amp;#39;https://github.com/&amp;#39;&lt;/span&gt;&lt;span style="color:#ff6ac1"&gt;+&lt;/span&gt;&lt;span style="color:#ff5c57"&gt;chr&lt;/span&gt;(x1)&lt;span style="color:#ff6ac1"&gt;+&lt;/span&gt;&lt;span style="color:#ff5c57"&gt;chr&lt;/span&gt;(x2)&lt;span style="color:#ff6ac1"&gt;+&lt;/span&gt;&lt;span style="color:#ff5c57"&gt;chr&lt;/span&gt;(x3)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; r&lt;span style="color:#ff6ac1"&gt;=&lt;/span&gt;requests&lt;span style="color:#ff6ac1"&gt;.&lt;/span&gt;get(url)
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt; &lt;span style="color:#ff5c57"&gt;print&lt;/span&gt;(url,r&lt;span style="color:#ff6ac1"&gt;.&lt;/span&gt;status_code)&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;p&gt;其中&lt;code&gt;range(97,123)&lt;/code&gt;就是遍历&lt;code&gt;a-z&lt;/code&gt;&lt;/p&gt;
&lt;p&gt;运行结果如下：&lt;/p&gt;
&lt;div class="highlight"&gt;&lt;pre tabindex="0" style="color:#e2e4e5;background-color:#282a36;-moz-tab-size:4;-o-tab-size:4;tab-size:4;-webkit-text-size-adjust:none;"&gt;&lt;code class="language-sh" data-lang="sh"&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;root@bwg:~# python3 ./gid.py
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;https://github.com/aaa status &lt;span style="color:#ff9f43"&gt;200&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;https://github.com/aab status &lt;span style="color:#ff9f43"&gt;200&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;https://github.com/aac status &lt;span style="color:#ff9f43"&gt;200&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;https://github.com/aad status &lt;span style="color:#ff9f43"&gt;200&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;https://github.com/aae status &lt;span style="color:#ff9f43"&gt;200&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;https://github.com/aaf status &lt;span style="color:#ff9f43"&gt;200&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;https://github.com/aag status &lt;span style="color:#ff9f43"&gt;200&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;https://github.com/aah status &lt;span style="color:#ff9f43"&gt;200&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span style="display:flex;"&gt;&lt;span&gt;... ...&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;</description></item></channel></rss>