话不多说,直接上脚本代码。代码不规范仅做记录使用
import cx_Oracle import pandas as pd import matplotlib.pyplot as plt import datetime import xlwt conn = cx_Oracle.connect('sys/root@127.0.0.1:1521/orcl') # 操作游标 cursor = conn.cursor() result = cursor.execute(r"select column from table order by xxx") # 一次读出所有内容到内存中,性能较差 all_data = cursor.fetchall() # 给列取上名字 chart = pd.DataFrame(all_data, columns=['one']) # 用数组去接收分组之后的值 # chart['one']//5*5 表示数字每五个分一组 ls = [] # 整句表示的是对取出来的整列数字进行分组统计,算出每一组的占比 ls = chart.groupby(chart['one']//5*5).count() / len(chart) print(ls['one']) # 表示将整列数字分组之后的占比存到txt中 text = chart.groupby(chart['one']//5*5).count() / len(chart) text.to_csv('point.txt', sep='\t', index=False) cursor.close() conn.close()值得注意的是: 1 直接对pandas(DataFrame)进行打印的时候,虽然只有一列数字,但是在命令行中会出现两列数字。类似:
100 0.11123 105 0.111111 110 0.222222但是存到txt文本后,只有
0.11123 0.111111 0.2222222 chart[‘one’]//5*5是两个斜杠