推荐一个开源库,轻松实现HTML转化为OpenXml。
01
项目简介
Html2OpenXml 是一个开源.Net库,旨在将简单或复杂的HTML内容转换为OpenXml组件。
该项目始于2009年,最初是为了将用户评论转换为Word文档而设计的
随着时间的推移,Html2OpenXml 不断发展和完善,现在已经成为处理HTML到OpenXml转换的强大工具。
02
项目核心功能
.Net支持版本:Html2OpenXml 支持.Net Framework 4.6.2、.NET Standard 2.0 和 .NET 8,确保了在不同.Net环境下的兼容性。
依赖:该库依赖于DocumentFormat.OpenXml和AngleSharp这两个包,分别用于处理OpenXml文档和HTML解析。
03
支持Html标签
常规标签:如<a>, <h1>-<h6>, <b>, <i>, <u>, <s>, <del>, <ins>, <em>, <strike>, <strong>等。
图像和图表:<img>, <figcaption>, <svg>。
表格相关:<table>, <td>, <tr>, <th>, <tbody>, <thead>, <tfoot>, <caption>, <col>。
其他常用标签:如<div>, <span>, <p>, <ul>, <ol>, <li>, <q>, <blockquote>, <article>, <aside>, <section>等。
需要注意的是,标签的样式属性style是支持的,但Java (<>), CSS样式(<style>), <meta>标签、注释、按钮和输入控件等HTML元素在转换过程中会被忽略。
04
使用示例
该项目有着详细的开发文档,并且项目中也提供示例。
开发文档:
https://github.com/onizet/html2openxml/wiki
Html转为Word示例截图
Html代码
转换后的Word截图
从截图可以看出Html标签、样式等都可以正常转换过来。
05
项目地址
https://github.com/onizet/html2openxml 返回搜狐,查看更多
责任编辑: