文件上传

文件上传功能支持多种辞书格式,通过智能解析配置将辞书内容转换为结构化数据,为后续的版本对比和分析提供基础。

支持文件格式

JSON

JSON 格式

结构化数据,适合程序处理

  • 标准数据格式
  • 层次结构清晰
  • 支持复杂数据类型
  • 易于程序解析
XML

XML 格式

标记语言,适合复杂辞书

  • 自描述结构
  • 支持命名空间
  • 样式表支持
  • 国际化友好
XLSX

Excel 表格

表格格式,适合批量处理

  • 可视化编辑
  • 公式支持
  • 数据验证功能
  • 格式广泛兼容

上传步骤

1

选择文件

点击上传区域或拖拽文件到指定区域选择要上传的辞书文件。

文件上传界面

文件上传界面

2

配置解析

选择适合的解析配置,或创建新的配置来定义词条识别规则。

解析配置界面

解析配置选择界面

3

开始上传

确认配置无误后,点击"开始上传"按钮开始处理文件。

上传进度

文件上传和处理进度

4

验证结果

上传完成后,检查解析结果,确认词条识别的准确性。

解析结果验证

解析结果验证界面

解析配置

解析配置定义了系统如何识别和提取辞书中的词条信息:

必填
词条模式 - 定义词条的识别规则,如正则表达式
必填
释义模式 - 定义释义内容的提取规则
可选
例句模式 - 定义例句的识别规则
可选
词性模式 - 定义词性信息的提取规则

文件要求

文件大小

  • 单个文件最大 100MB
  • 建议文件大小在 10MB 以下
  • 大文件可能处理时间较长
  • 超过限制请分割文件

编码格式

  • 推荐使用 UTF-8 编码
  • 避免使用 GBK、GB2312 等旧编码
  • 上传前检查文件编码
  • 编码错误可能导致解析失败

文件结构

  • 确保文件结构清晰一致
  • 避免使用复杂的格式
  • 检查是否有特殊字符
  • 建议先小批量测试

错误处理

⚠️

格式错误

检查文件格式是否符合要求,编码是否正确

🔧

解析失败

调整解析配置,优化识别规则

📊

识别率低

检查文件结构,改进配置规则

🔄

重新上传

修正问题后重新上传文件

最佳实践

预处理文件

上传前先整理文件格式,确保结构统一,编码正确。

测试配置

使用小文件测试解析配置,确认效果后再上传完整文件。

监控进度

上传过程中监控处理进度,及时发现和解决问题。

验证结果

上传完成后仔细验证解析结果,确保数据准确性。

常见问题

上传失败怎么办?
检查网络连接、文件大小、格式是否符合要求,可以尝试重新上传或联系技术支持。
如何提高解析准确率?
优化解析配置,使用适合的识别规则,确保文件结构清晰一致。
可以批量上传吗?
目前支持单个文件上传,如需处理多个文件,请分别上传或联系技术支持。