brat标注工具知识总结

医疗实体识别、关系抽取标注工具

  • 哈工大开源标注工具
    这个项目中不仅提供了用于命名实体识别和关系抽取的医疗数据标注工具,还提供了标注规范文档和可用于测试标注工具的部分电子病历样例。
    https://github.com/WILAB-HIT/Resources

  • BRAT
    官网:http://brat.nlplab.org/index.html
    安装包:https://github.com/nlplab/brat/releases/tag/v1.3_Crunchy_Frog
    可视化效果很好,配置也比较方便,感觉可以用brat来标注,用哈工大的标注规范作为咱们制定标注规范的参考。brat需要在linux系统安装,我用vmware装了虚拟机,在ubuntu中简单试用了一下,效果如下

标注思路

医疗知识图谱相关的讲座,数研院介绍了他们标注实体和实体关系时,采用的预标注+人工校对的思路,感觉对提高标注效率还挺有帮助的。
https://mp.weixin.qq.com/s/gDMCfHP1xN7erjxvA-NZSw

BRAT

参考文档

Brat标注工具(本地)安装及使用【包含demo】
https://blog.csdn.net/p_jinsan/article/details/96152078

Brat文本注释工具的使用文档
介绍了事件抽取的标注方法
https://blog.csdn.net/Jay_Josby/article/details/103569721

Brat标注系统说明
介绍了快捷键
http://ws.nju.edu.cn/blog/2018/06/brat%E6%A0%87%E6%B3%A8%E7%B3%BB%E7%BB%9F%E8%AF%B4%E6%98%8E/

BRAT的安装、配置、标注操作
整体内容写的很详细。其中介绍了标注属性的相关内容。
https://blog.csdn.net/weixin_42927998/article/details/106623370

Brat docker image

  • https://hub.docker.com/r/heliex/docker-brat
    这个挺好用,不过作者把镜像取消了分享。我导出了作者之前上传的镜像,镜像下载链接如下:
    链接:https://pan.baidu.com/s/11Z5LwtLowwb10xq1gomSSQ
    提取码:fcp5
    镜像用法:
    docker run -p 8080:80 -v /d/xx/brat-v1.3_Crunchy_Frog/data_docker/:/var/www/brat/data/annotatordata -d heliex/docker-brat
    将上述命令中“/d/xx/brat-v1.3_Crunchy_Frog/data_docker/”换为本地存放data的地址就好。
    brat config文件和data放在同一个文件夹即可生效。

  • https://hub.docker.com/r/cassj/brat
    这个没试过

其他

  • HTML颜色代码
    https://htmlcolorcodes.com/zh/

  • 添加用户
    直接在config.py文件中添加
    USER_PASSWORD = {
    ‘admn’: ‘admin’,
    ‘test’: ‘test’,
    }
    在这里插入图片描述

error

python序列标注平台brat,文件换行为CRLF(\r\n)导致的bug记录
https://zhuanlan.zhihu.com/p/119316158

猜你喜欢

转载自blog.csdn.net/xyl295528322/article/details/117388994