🗄️ 数据文件

下载各种格式的示例数据文件，用于数据库和大数据测试

11 个格式

📋 JSON 示例文件 .json 3 下载

📑 XML 数据文件 .xml 3 下载

📜 YAML 示例文件 .yaml 3 下载

🍃 BSON 示例文件 .bson 3 下载

📦 MessagePack 示例文件 .msgpack 3 下载

🗄️ SQL 示例文件 .sql 3 下载

🗄️ SQLite 示例文件 .sqlite 3 下载

📊 Parquet 示例文件 .parquet 3 下载

📊 Avro 示例文件 .avro 3 下载

📊 大型 CSV 示例 .csv 2 下载

⚡ Protocol Buffers 示例 .proto 3 下载

「数据测试用样例」导向的索引解决什么问题？

测试工程师搜索「data file samples for testing」「csv 边界测试数据」时，需要可重复触发边界行为的输入：引号错位、缺失列、异常换行、重复 JSON 键、XML 实体膨胀、YAML 锚点循环、Avro Schema 不兼容、SQLite 锁冲突等。本变体强调测试资产化——数据子库按格式分类，便于映射用例 ID、自动化套件与探索性测试章程。与演示型示例不同，测试样张应配对预期：解析错误码、拒绝行数、落库列类型、流式内存峰值。缺陷系统应固定字段记录样张 URL 与哈希。混沌注入前可用干净 JSON 建立基线，再引入边界 CSV；性能测试用大档并标注并发。本页作为数据类测试入口，与各格式落地页专项 FAQ 组成两层文档；样张更新时归档旧哈希，避免历史工单无法复现。

如何把数据样张写入测试计划？

按目标（导入/Schema/流式/列式下推）在本页挑选格式与边界档位。
为每条用例绑定链接、哈希、预期结果与失败判定标准。
执行后附解析日志与行级采样；勿在用例中途更换样张。

数据测试样张 FAQ

冒烟与全量回归各需要多少数据样张？

冒烟常见组合：小 JSON + 小 CSV + YAML；全量按矩阵扩展至 Parquet、Avro、SQLite、Protobuf 等。数量取决于发布风险，本页提供全集来源。

Golden 解析测试如何选样？

选结构稳定、少浮点漂移的 JSON/CSV，固定解析器版本与环境 locale；变更样张或依赖时需整体更新期望输出并评审 diff，在工单注明基线版本号。

如何测试 Schema 校验与容错策略？

选用含类型冲突或缺失必填字段的 JSON/XML 样张，分别验证 strict 与 tolerant 模式；记录校验器版本与错误路径，失败时附 schema 名称与行号。

流式导入如何用样张压测？

使用 large-csv 档位并设置分片大小、背压与行级错误上限；对比吞吐与内存曲线，将 Runner 规格写入缺陷以免误判环境限制。

样张更新后历史缺陷无法复现？

工单应永久保存当时哈希；中心库更新时在归档区保留旧文件或注明废弃版本，新基线通过后再关闭历史单，避免误判已修复。

JSON 格式化

Base64 编码

URL 编码

YAML 格式化

XML 格式化

SQL 格式化

JWT 解码器

合并 PDF

压缩 PDF

拆分 PDF

编辑 PDF

PDF 转 Word

Word 转 PDF

PDF 转 JPG

AI 文生图

去背景

背景透明化

压缩图片

调整尺寸

超分辨率

人脸修复

AI 深度翻译

段落写作

智能邮件助手

句子改写

文本摘要

语法修正

代码注释

腾讯视频 VIP 播放

爱奇艺 VIP 播放

优酷 VIP 播放

芒果TV VIP 播放

YouTube 下载

抖音下载

视频号下载

CSV 转 Excel

Excel 转 PDF

XML 转 JSON

拆分 Excel

拆分 CSV

XML 转 Excel

Excel 转 XML

🗄️ 数据文件

「数据测试用样例」导向的索引解决什么问题？

如何把数据样张写入测试计划？

数据测试样张 FAQ