这东西2016年我们中心就做过了,发现用不了。后来交给ai lab发了几篇论文就不了了之了。
感觉学术界就在刷数据集,就没人关心生成的caption到底能不能用[飙泪笑]
总之,这个领域学界和落地之间的gap非常大。不太建议你入这个坑
有谁知道image caption成功落地的,欢迎分享一下