标签:: pandas

0

pandas.read_sql的误导性参数chunksize

官方文档的描述是该参数返回一个迭代的对象,该对象包含很多个chunksize大小的块。容易误导人的是设置chunksize之后,从数据获取数据就不会一次返回所有的数据,而是分块的返回。 更烦的是这个情况还不容易察觉。当使用sqlalchemy+pymssql连接MSSQL导出一张100W行数据的表,chunksize给人的表现看起来就是每次只获取部分,内存并没有太大变化,而当使用sqlalchem