Python如何使用reportlab实现制作pdf报告

寻技术 Python编程 2024年01月25日 115

这篇文章主要讲解了“Python如何使用reportlab实现制作pdf报告”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python如何使用reportlab实现制作pdf报告”吧!

    reportlab是什么

    reportlab是Python的一个标准库,可以画图、画表格、编辑文字,最后可以输出PDF格式。它的逻辑和编辑一个word文档或者PPT很像。有两种方法:

    1)建立一个空白文档,然后在上面写文字、画图等;

    2)建立一个空白list,以填充表格的形式插入各种文本框、图片等,最后生成PDF文档。

    因为需要产生一份给用户看的报告,里面需要插入图片、表格等,所以采用的是第二种方法。

    **由于我们这个功能是django网站项目上,我们并不想生成一个文件,第二种方法还可以生成io流文件,进而传递给前端生成pdf,这样后端就不存在文件的存写读的操作了。**本篇文章在方法2的基础上,加入了reportlab生成流文件格式、reportlab分页和图片流文件写入reportlab等功能。

    安装和导入库

    pip install reportlab

    代码如下(示例):

    from reportlab.pdfbase import pdfmetrics   # 注册字体
    from reportlab.pdfbase.ttfonts import TTFont # 字体类
    from reportlab.platypus import Table, SimpleDocTemplate, Paragraph, Image  # 报告内容相关类
    from reportlab.lib.pagesizes import letter  # 页面的标志尺寸(8.5*inch, 11*inch)
    from reportlab.lib.styles import getSampleStyleSheet  # 文本样式
    from reportlab.lib import colors  # 颜色模块
    from reportlab.graphics.charts.barcharts import VerticalBarChart  # 图表类
    from reportlab.graphics.charts.legends import Legend  # 图例类
    from reportlab.graphics.shapes import Drawing  # 绘图工具
    from reportlab.lib.units import cm  # 单位:cm
     
    # 注册字体(提前准备好字体文件, 如果同一个文件需要多种字体可以注册多个)
    pdfmetrics.registerFont(TTFont('SimSun', 'SimSun.ttf'))

    将画图、画表格、编辑文字抽象为类

    抽象为类后,可实现多次调用,方便处理。这里我将页眉和页脚的方法也放在了抽象类中。在生成文件时,实现pdf报告的自动分页。

    class Graphs(object):
    
        def __init__(self):
            # 获取所有样式表
            self.style = getSampleStyleSheet()
    
        # 绘制标题
        def draw_1_title(self, title1: str):
            # 拿到标题样式
            ct = self.style['Heading1']
            # 单独设置样式相关属性
            ct.fontName = 'hei'  # 字体名
            ct.fontSize = 20  # 字体大小
            ct.leading = 1.5 * ct.fontSize  # 行间距
            ct.textColor = colors.black  # 字体颜色
            ct.alignment = 1  # 居中
            return Paragraph(title1, ct)
    
        # 绘制小标题(黑色)
        def draw_2_title(self, title: str, content: str):
            # 拿到标题样式
            ct = self.style['Normal']
            # 单独设置样式相关属性
            ct.fontName = 'song'  # 字体名
            ct.fontSize = 15  # 字体大小
            ct.leading = 1.5 * ct.fontSize  # 行间距
            ct.textColor = colors.black  # 字体颜色
            return Paragraph(("<font name='Dengb'>%s</font>" % title) + content, ct)
    
        # 绘制普通段落内容
        def draw_text(self, text: str):
            # 获取普通样式
            ct = self.style['Normal']
            ct.fontName = 'song'
            ct.fontSize = 12
            ct.leading = 1.5 * ct.fontSize  # 行间距
            ct.wordWrap = 'CJK'  # 设置自动换行
            ct.alignment = 0  # 左对齐
            ct.firstLineIndent = 32  # 第一行开头空格
            ct.leading = 25
            return Paragraph(text, ct)
    
        # 绘制表格标题
        def draw_table_title(self, title: str):
            # 拿到标题样式
            ct = self.style['Heading1']
            # 单独设置样式相关属性
            ct.fontName = 'Dengb'  # 字体名
            ct.fontSize = 14  # 字体大小
            ct.leading = 15  # 行间距
            ct.textColor = colors.black  # 字体颜色
            ct.alignment = 1  # 居中
            ct.bold = True
            # 创建标题对应的段落,并且返回
            return Paragraph(title, ct)
    
        # 绘制表格
        @staticmethod
        def draw_table(*args):
            # 列宽度
            col_width = [50, 300, 50, 50]
            style = TableStyle(
                [('FONTNAME', (0, 0), (-1, -1), 'song'),  # 全表字体
                 ('FONTNAME', (0, 0), (-1, 0), 'Dengb'),  # 首行字体
                 ('FONTSIZE', (0, 0), (-1, 0), 12),  # 第一行的字体大小
                 ('FONTSIZE', (0, 1), (-1, -1), 10),  # 第二行到最后一行的字体大小
                 ('ALIGN', (0, 0), (-1, -1), 'CENTER'),  # 第一行水平居中
                 ('VALIGN', (0, 0), (-1, -1), 'MIDDLE'),  # 所有表格上下居中对齐
                 ('TEXTCOLOR', (0, 0), (-1, -1), colors.black),  # 设置表格内文字颜色(不包含第一行)
                 ('GRID', (0, 0), (-1, -1), 0.5, colors.black),  # 设置表格框线为grey色,线宽为0.5
                 # ('SPAN', (0, 1), (0, 2)),  # 合并第一列二三行
                 # ('SPAN', (0, 3), (0, 4)),  # 合并第一列三四行
                 # ('SPAN', (0, 5), (0, 6)),  # 合并第一列五六行
                 # ('SPAN', (0, 7), (0, 8)),  # 合并第一列五六行
                 ])
            table = Table(args, colWidths=col_width, style=style)
            return table
    
        # 创建图表
        @staticmethod
        def draw_bar(bar_data: list, ax: list, items: list):
            drawing = Drawing(500, 250)
            bc = VerticalBarChart()
            bc.x = 45  # 整个图表的x坐标
            bc.y = 45  # 整个图表的y坐标
            bc.height = 200  # 图表的高度
            bc.width = 350  # 图表的宽度
            bc.data = bar_data
            bc.strokeColor = colors.black  # 顶部和右边轴线的颜色
            bc.valueAxis.valueMin = 5000  # 设置y坐标的最小值
            bc.valueAxis.valueMax = 26000  # 设置y坐标的最大值
            bc.valueAxis.valueStep = 2000  # 设置y坐标的步长
            bc.categoryAxis.labels.dx = 2
            bc.categoryAxis.labels.dy = -8
            bc.categoryAxis.labels.angle = 20
            bc.categoryAxis.categoryNames = ax
    
            # 图示
            leg = Legend()
            leg.fontName = 'song'
            leg.alignment = 'right'
            leg.boxAnchor = 'ne'
            leg.x = 475  # 图例的x坐标
            leg.y = 240
            leg.dxTextSpace = 10
            leg.columnMaximum = 3
            leg.colorNamePairs = items
            drawing.add(leg)
            drawing.add(bc)
            return drawing
    
        # 绘制图片
        @staticmethod
        def draw_img(path):
            img = Image(path, width=500, height=500, kind='bound')  # 读取指定路径下的图片
            return img
    
        # 设置页脚
        def footer(self, canvas, doc):
            """
            设置页脚--页码
            :param canvas:Canvas类型  pdf画布
            :param doc:doc类型   整个pdf文件
            """  # 拿到标题样式
            ct = self.style['Heading1']
            # 单独设置样式相关属性
            ct.fontName = 'song'  # 字体名
            ct.fontSize = 14  # 字体大小
            ct.leading = 15  # 行间距
            ct.textColor = colors.black  # 字体颜色
            ct.alignment = 1  # 居中
            canvas.saveState()  # 先保存当前的画布状态
            pageNumber = ("%s" % canvas.getPageNumber())  # 获取当前的页码
            p = Paragraph(pageNumber, ct)
            p.wrap(1 * cm, 1 * cm)  # 申请一块1cm大小的空间,返回值是实际使用的空间
            p.drawOn(canvas, 520, 50)  # 将页码放在指示坐标处
            canvas.restoreState()
    
        # 设置页眉
        def header(self, canvas, doc):
            """
            设置页眉
            :param canvas:Canvas类型  pdf画布
            :param doc:doc类型     整个pdf文件
            https://cxybb.com/article/liyadian/81253117
            """
            canvas.saveState()
            im = Image("utils/map_png/image/logo.png", height=20, width=98)
            im.drawOn(canvas, 430, 780)
            # canvas.setStrokeColorRGB(0.8, 0.8, 0.8)
            # canvas.setFillColorRGB(0, 0, 0)
            # canvas.line(15, 28, doc.width - 15, 28)
            # canvas.setFont('regular', 8)
            # str = f"XXX银行 | Page {doc.page}"
            # textLen = stringWidth(str, 'regular', 8)
            # canvas.drawCentredString(int((doc.width - textLen) / 2), 0.15 * inch, str)
            canvas.restoreState()

    pdf插入图片

    pdf中插入图片会有2中方式,网络上常用的方式都是文件路径,本片文章的图片是通过Html2Image生成的,无法保存成流文件格式,只能保存至本地文件。但是如果图片是通过其他途径生成的,可以直接以流文件的方式写入pdf,这样可以节省文件的创建、写入、读取和删除等操作,节省内存和磁盘空间。

    以文件路径写入pdf

        # base 是当前文件所在路径的上一级路径,此种方法适用Windows和linux等多种系统,其他方法无法保证,多系统路径是否一致。
        base = Path(__file__).resolve().parent
        # out_file就是文件名字(即Html2Image生成的图片),img_path 是拼接后的文件路径
        content.append(graphs.draw_table_title('图1 影像覆盖情况'))
        img_path = os.path.join(base, 'map_png', out_file)
        content.append(graphs.draw_img(img_path))
        content.append(Spacer(0, 10))

    以流文件写入pdf

    from pillow import Image as pilImage
    
    	with open('test.png',mode='rb') as f:
    		# 读取到图片
    	    content.append(graphs.draw_img(f))
    	    content.append(Spacer(0, 10))

    pdf分页

    在第二部分我们已经写入了pdf页眉和页脚的方法和参数,具体如何加载到pdf中可以参考下列方法。

        doc = SimpleDocTemplate('report.pdf', pagesize=letter)
        # 声明一块Frame,存放页码
        frame_footer = Frame(doc.leftMargin, doc.bottomMargin, doc.width, doc.height, id='normal')
        # 设置页面模板,在加载页面时先运行herder函数,在加载完页面后运行footer函数
        template = PageTemplate(id='test', frames=frame_footer, onPage=graphs.header, onPageEnd=graphs.footer)
        doc.addPageTemplates([template])
        doc.build(content)

    以生成pdf流文件为例

    def pics_2_pdf(info, table, out_file):
        """
        info:基本信息
        table:表格数据
        """
        # 获取Graphs类
        graphs = Graphs()
        # 创建内容对应的空列表
        content = list()
    
        # 1.添加标题
        content.append(graphs.draw_1_title('数据中心'))
    	# 隔行的高度
        content.append(Spacer(0, 10))
        
        # 2.添加小标题
        content.append(graphs.draw_2_title("报告形成日期: ", str(datetime.date.today().strftime("%Y/%m/%d"))))
        content.append(Spacer(0, 10))
        
        # 3.添加图片
        base = Path(__file__).resolve().parent
        content.append(graphs.draw_table_title('图1 影像覆盖情况'))
        img_path = os.path.join(base, 'map_png', out_file)
        content.append(graphs.draw_img(img_path))
        content.append(Spacer(0, 10))
        # 4.添加表格标题
        content.append(graphs.draw_table_title('表1 框选区域覆盖数据清单'))
        # 5.添加表格数据
        # data = [
        #     ['职位名称', '平均薪资', '较上年增长率'],
        #     ['数据分析师', '18.5K', '25%'],
        #     ('高级数据分析师', '25.5K', '14%'),
        #     ('资深数据分析师', '29.3K', '10%')
        # ]
        content.append(graphs.draw_table(*table))
        # 生成图表
        # content.append(Graphs.draw_title(''))
        # content.append(Graphs.draw_little_title('热门城市的就业情况'))
        # b_data = [(25400, 12900, 20100, 20300, 20300, 17400), (15800, 9700, 12982, 9283, 13900, 7623)]
        # ax_data = ['BeiJing', 'ChengDu', 'ShenZhen', 'ShangHai', 'HangZhou', 'NanJing']
        # leg_items = [(colors.red, '平均薪资'), (colors.green, '招聘量')]
        # content.append(Graphs.draw_bar(b_data, ax_data, leg_items))
        # 添加文字
        # content.append(Graphs.draw_text(
        #     '众所周知,大数据分析师岗位是香饽饽,近几年数据分析热席卷了整个互联网行业,与数据分析的相关的岗位招聘、培训数不胜数。很多人前赴后继,想要参与到这波红利当中。那么数据分析师就业前景到底怎么样呢?'))
    
        # 生成pdf文件
        # 方式一:
        # doc = SimpleDocTemplate('report.pdf', pagesize=letter)
        # 方式二-存储文件:
        # doc = BaseDocTemplate('report.pdf')
        # 方式二-流文件格式
        buffer = io.BytesIO()  # 重点 起一个 io
        doc = BaseDocTemplate(buffer)
    
        # 声明一块Frame,存放页码
        frame_footer = Frame(doc.leftMargin, doc.bottomMargin, doc.width, doc.height, id='normal')
        # 设置页面模板,在加载页面时先运行herder函数,在加载完页面后运行footer函数
        template = PageTemplate(id='test', frames=frame_footer, onPage=graphs.header, onPageEnd=graphs.footer)
        doc.addPageTemplates([template])
        doc.build(content)
        return buffer
    关闭

    用微信“扫一扫”