您好
在复现过程中我们发现在MMEB V2 Benchmark上,Image和Video相关的任务的性能基本上和论文中一致,但是Visdoc的性能差的比较多,
| Models |
VDOC-VDRv1 |
VDOC-VDRv2 |
VDOC-VR |
VDOC-OOD |
VDOC-Overall |
| Reported |
72.4 |
46.2 |
79.2 |
37.2 |
63.9 |
| Recreated |
61.2 |
46.3 |
69.1 |
41.2 |
54.5 |
我看到MMEB的repo中也有人提类似的问题:TIGER-AI-Lab/VLM2Vec#149
TIGER-AI-Lab/VLM2Vec#194
可能是数据集的问题,请问能否共享一下你们使用的visdoc测试集
您好
在复现过程中我们发现在MMEB V2 Benchmark上,Image和Video相关的任务的性能基本上和论文中一致,但是Visdoc的性能差的比较多,
我看到MMEB的repo中也有人提类似的问题:TIGER-AI-Lab/VLM2Vec#149
TIGER-AI-Lab/VLM2Vec#194
可能是数据集的问题,请问能否共享一下你们使用的visdoc测试集