大模型知识库扒皮库
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
-
+
首页
知识星球 | 深度连接铁杆粉丝,运营高品质社群,知识变现的工具
来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230700_9157150.7806504229221279.jpeg) HuggingAI 2024-03-22 07:40 DetToolChain 是一种创新的提示策略,致力于充分挖掘 MLLM 的检测潜能。 我们创新推出的 DetToolChain 提示模式能够充分挖掘 GPT-4V、Gemini 等多模态大型语言模型的零样本对象检测潜力。该方法整合了一套以精密检测原理为灵感的检测提示工具箱,以及一套全新的 Chain-of-Thought 实施策略。这套工具箱内的提示巧妙设计,引导 MLLM 专注局部信息(比如局部放大),参照测量准则解读坐标(比如虚拟尺规辅助),并能依据情境信息推理判断(比如叠加场景图分析)。借助这一系列工具,新式的检测思维链可以自动化地将复杂任务拆解为若干简单子任务,对预测结果进行诊断,并有条不紊地规划边界框精修步骤。实验证明,无论是在广泛的各种检测任务中,还是在极具挑战性的难题上,我们的框架都展现出显著效果。相较于当前最先进的方法,搭载了 DetToolChain 的 GPT-4V 在 MS COCO 新类别集的开放词汇检测任务上提升了 +21.5% 的 AP50,在 RefCOCO val 集的零样本指示理解任务上提高了 +24.23% 的准确率,在 D-cube 完整设置下的描述对象检测任务上也实现了 +14.5% 的 AP 提升。 原文链接:[\[2403.12488\] DetToolChain: A New Prompting Paradig...](https://arxiv.org/abs/2403.12488 "[2403.12488] DetToolChain: A New Prompting Paradig...") #arXiv论文# #LLM应用# #计算机视觉# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230701_1319890.47773878239300194.jpeg) arXiv论文 LLM应用 计算机视觉来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230700_9302000.7909623936416963.jpeg) HuggingAI 2024-03-22 07:40 DetToolChain 是一种创新的提示策略,致力于充分挖掘 MLLM 的检测潜能。 我们创新推出的 DetToolChain 提示模式能够充分挖掘 GPT-4V、Gemini 等多模态大型语言模型的零样本对象检测潜力。该方法整合了一套以精密检测原理为灵感的检测提示工具箱,以及一套全新的 Chain-of-Thought 实施策略。这套工具箱内的提示巧妙设计,引导 MLLM 专注局部信息(比如局部放大),参照测量准则解读坐标(比如虚拟尺规辅助),并能依据情境信息推理判断(比如叠加场景图分析)。借助这一系列工具,新式的检测思维链可以自动化地将复杂任务拆解为若干简单子任务,对预测结果进行诊断,并有条不紊地规划边界框精修步骤。实验证明,无论是在广泛的各种检测任务中,还是在极具挑战性的难题上,我们的框架都展现出显著效果。相较于当前最先进的方法,搭载了 DetToolChain 的 GPT-4V 在 MS COCO 新类别集的开放词汇检测任务上提升了 +21.5% 的 AP50,在 RefCOCO val 集的零样本指示理解任务上提高了 +24.23% 的准确率,在 D-cube 完整设置下的描述对象检测任务上也实现了 +14.5% 的 AP 提升。 原文链接:[\[2403.12488\] DetToolChain: A New Prompting Paradig...](https://arxiv.org/abs/2403.12488 "[2403.12488] DetToolChain: A New Prompting Paradig...") #arXiv论文# #LLM应用# #计算机视觉# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230701_1332920.8510265855796058.jpeg) arXiv论文 LLM应用 计算机视觉来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230700_9263250.008447647722738871.jpeg) HuggingAI 2024-03-22 07:40 DetToolChain 是一种创新的提示策略,致力于充分挖掘 MLLM 的检测潜能。 我们创新推出的 DetToolChain 提示模式能够充分挖掘 GPT-4V、Gemini 等多模态大型语言模型的零样本对象检测潜力。该方法整合了一套以精密检测原理为灵感的检测提示工具箱,以及一套全新的 Chain-of-Thought 实施策略。这套工具箱内的提示巧妙设计,引导 MLLM 专注局部信息(比如局部放大),参照测量准则解读坐标(比如虚拟尺规辅助),并能依据情境信息推理判断(比如叠加场景图分析)。借助这一系列工具,新式的检测思维链可以自动化地将复杂任务拆解为若干简单子任务,对预测结果进行诊断,并有条不紊地规划边界框精修步骤。实验证明,无论是在广泛的各种检测任务中,还是在极具挑战性的难题上,我们的框架都展现出显著效果。相较于当前最先进的方法,搭载了 DetToolChain 的 GPT-4V 在 MS COCO 新类别集的开放词汇检测任务上提升了 +21.5% 的 AP50,在 RefCOCO val 集的零样本指示理解任务上提高了 +24.23% 的准确率,在 D-cube 完整设置下的描述对象检测任务上也实现了 +14.5% 的 AP 提升。 原文链接:[\[2403.12488\] DetToolChain: A New Prompting Paradig...](https://arxiv.org/abs/2403.12488 "[2403.12488] DetToolChain: A New Prompting Paradig...") #arXiv论文# #LLM应用# #计算机视觉# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230701_1392890.843224715103951.jpeg) arXiv论文 LLM应用 计算机视觉来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230700_9392240.5109804351159125.jpeg) HuggingAI 2024-03-22 07:40 DetToolChain 是一种创新的提示策略,致力于充分挖掘 MLLM 的检测潜能。 我们创新推出的 DetToolChain 提示模式能够充分挖掘 GPT-4V、Gemini 等多模态大型语言模型的零样本对象检测潜力。该方法整合了一套以精密检测原理为灵感的检测提示工具箱,以及一套全新的 Chain-of-Thought 实施策略。这套工具箱内的提示巧妙设计,引导 MLLM 专注局部信息(比如局部放大),参照测量准则解读坐标(比如虚拟尺规辅助),并能依据情境信息推理判断(比如叠加场景图分析)。借助这一系列工具,新式的检测思维链可以自动化地将复杂任务拆解为若干简单子任务,对预测结果进行诊断,并有条不紊地规划边界框精修步骤。实验证明,无论是在广泛的各种检测任务中,还是在极具挑战性的难题上,我们的框架都展现出显著效果。相较于当前最先进的方法,搭载了 DetToolChain 的 GPT-4V 在 MS COCO 新类别集的开放词汇检测任务上提升了 +21.5% 的 AP50,在 RefCOCO val 集的零样本指示理解任务上提高了 +24.23% 的准确率,在 D-cube 完整设置下的描述对象检测任务上也实现了 +14.5% 的 AP 提升。 原文链接:[\[2403.12488\] DetToolChain: A New Prompting Paradig...](https://arxiv.org/abs/2403.12488 "[2403.12488] DetToolChain: A New Prompting Paradig...") #arXiv论文# #LLM应用# #计算机视觉# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230701_1375020.1114637895979601.jpeg) arXiv论文 LLM应用 计算机视觉来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230700_9906630.9081843462522061.jpeg) HuggingAI 2024-03-22 07:40 DetToolChain 是一种创新的提示策略,致力于充分挖掘 MLLM 的检测潜能。 我们创新推出的 DetToolChain 提示模式能够充分挖掘 GPT-4V、Gemini 等多模态大型语言模型的零样本对象检测潜力。该方法整合了一套以精密检测原理为灵感的检测提示工具箱,以及一套全新的 Chain-of-Thought 实施策略。这套工具箱内的提示巧妙设计,引导 MLLM 专注局部信息(比如局部放大),参照测量准则解读坐标(比如虚拟尺规辅助),并能依据情境信息推理判断(比如叠加场景图分析)。借助这一系列工具,新式的检测思维链可以自动化地将复杂任务拆解为若干简单子任务,对预测结果进行诊断,并有条不紊地规划边界框精修步骤。实验证明,无论是在广泛的各种检测任务中,还是在极具挑战性的难题上,我们的框架都展现出显著效果。相较于当前最先进的方法,搭载了 DetToolChain 的 GPT-4V 在 MS COCO 新类别集的开放词汇检测任务上提升了 +21.5% 的 AP50,在 RefCOCO val 集的零样本指示理解任务上提高了 +24.23% 的准确率,在 D-cube 完整设置下的描述对象检测任务上也实现了 +14.5% 的 AP 提升。 原文链接:[\[2403.12488\] DetToolChain: A New Prompting Paradig...](https://arxiv.org/abs/2403.12488 "[2403.12488] DetToolChain: A New Prompting Paradig...") #arXiv论文# #LLM应用# #计算机视觉# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230701_1445170.9037991110088518.jpeg) arXiv论文 LLM应用 计算机视觉来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230700_9306710.42203702376720265.jpeg) HuggingAI 2024-03-22 07:40 DetToolChain 是一种创新的提示策略,致力于充分挖掘 MLLM 的检测潜能。 我们创新推出的 DetToolChain 提示模式能够充分挖掘 GPT-4V、Gemini 等多模态大型语言模型的零样本对象检测潜力。该方法整合了一套以精密检测原理为灵感的检测提示工具箱,以及一套全新的 Chain-of-Thought 实施策略。这套工具箱内的提示巧妙设计,引导 MLLM 专注局部信息(比如局部放大),参照测量准则解读坐标(比如虚拟尺规辅助),并能依据情境信息推理判断(比如叠加场景图分析)。借助这一系列工具,新式的检测思维链可以自动化地将复杂任务拆解为若干简单子任务,对预测结果进行诊断,并有条不紊地规划边界框精修步骤。实验证明,无论是在广泛的各种检测任务中,还是在极具挑战性的难题上,我们的框架都展现出显著效果。相较于当前最先进的方法,搭载了 DetToolChain 的 GPT-4V 在 MS COCO 新类别集的开放词汇检测任务上提升了 +21.5% 的 AP50,在 RefCOCO val 集的零样本指示理解任务上提高了 +24.23% 的准确率,在 D-cube 完整设置下的描述对象检测任务上也实现了 +14.5% 的 AP 提升。 原文链接:[\[2403.12488\] DetToolChain: A New Prompting Paradig...](https://arxiv.org/abs/2403.12488 "[2403.12488] DetToolChain: A New Prompting Paradig...") #arXiv论文# #LLM应用# #计算机视觉# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230701_2347140.611341780083054.jpeg) arXiv论文 LLM应用 计算机视觉来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230701_0096120.8289345545815703.jpeg) HuggingAI 2024-03-22 07:40 DetToolChain 是一种创新的提示策略,致力于充分挖掘 MLLM 的检测潜能。 我们创新推出的 DetToolChain 提示模式能够充分挖掘 GPT-4V、Gemini 等多模态大型语言模型的零样本对象检测潜力。该方法整合了一套以精密检测原理为灵感的检测提示工具箱,以及一套全新的 Chain-of-Thought 实施策略。这套工具箱内的提示巧妙设计,引导 MLLM 专注局部信息(比如局部放大),参照测量准则解读坐标(比如虚拟尺规辅助),并能依据情境信息推理判断(比如叠加场景图分析)。借助这一系列工具,新式的检测思维链可以自动化地将复杂任务拆解为若干简单子任务,对预测结果进行诊断,并有条不紊地规划边界框精修步骤。实验证明,无论是在广泛的各种检测任务中,还是在极具挑战性的难题上,我们的框架都展现出显著效果。相较于当前最先进的方法,搭载了 DetToolChain 的 GPT-4V 在 MS COCO 新类别集的开放词汇检测任务上提升了 +21.5% 的 AP50,在 RefCOCO val 集的零样本指示理解任务上提高了 +24.23% 的准确率,在 D-cube 完整设置下的描述对象检测任务上也实现了 +14.5% 的 AP 提升。 原文链接:[\[2403.12488\] DetToolChain: A New Prompting Paradig...](https://arxiv.org/abs/2403.12488 "[2403.12488] DetToolChain: A New Prompting Paradig...") #arXiv论文# #LLM应用# #计算机视觉# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230701_2370500.05370133427084156.jpeg) arXiv论文 LLM应用 计算机视觉来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230701_0227950.5863212825927744.jpeg) HuggingAI 2024-03-22 07:40 DetToolChain 是一种创新的提示策略,致力于充分挖掘 MLLM 的检测潜能。 我们创新推出的 DetToolChain 提示模式能够充分挖掘 GPT-4V、Gemini 等多模态大型语言模型的零样本对象检测潜力。该方法整合了一套以精密检测原理为灵感的检测提示工具箱,以及一套全新的 Chain-of-Thought 实施策略。这套工具箱内的提示巧妙设计,引导 MLLM 专注局部信息(比如局部放大),参照测量准则解读坐标(比如虚拟尺规辅助),并能依据情境信息推理判断(比如叠加场景图分析)。借助这一系列工具,新式的检测思维链可以自动化地将复杂任务拆解为若干简单子任务,对预测结果进行诊断,并有条不紊地规划边界框精修步骤。实验证明,无论是在广泛的各种检测任务中,还是在极具挑战性的难题上,我们的框架都展现出显著效果。相较于当前最先进的方法,搭载了 DetToolChain 的 GPT-4V 在 MS COCO 新类别集的开放词汇检测任务上提升了 +21.5% 的 AP50,在 RefCOCO val 集的零样本指示理解任务上提高了 +24.23% 的准确率,在 D-cube 完整设置下的描述对象检测任务上也实现了 +14.5% 的 AP 提升。 原文链接:[\[2403.12488\] DetToolChain: A New Prompting Paradig...](https://arxiv.org/abs/2403.12488 "[2403.12488] DetToolChain: A New Prompting Paradig...") #arXiv论文# #LLM应用# #计算机视觉# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230701_2280910.022634558444964314.jpeg) arXiv论文 LLM应用 计算机视觉来自:大语言模型论文跟踪进入星球 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230701_0107270.6239689089933059.jpeg) HuggingAI 2024-03-22 07:40 DetToolChain 是一种创新的提示策略,致力于充分挖掘 MLLM 的检测潜能。 我们创新推出的 DetToolChain 提示模式能够充分挖掘 GPT-4V、Gemini 等多模态大型语言模型的零样本对象检测潜力。该方法整合了一套以精密检测原理为灵感的检测提示工具箱,以及一套全新的 Chain-of-Thought 实施策略。这套工具箱内的提示巧妙设计,引导 MLLM 专注局部信息(比如局部放大),参照测量准则解读坐标(比如虚拟尺规辅助),并能依据情境信息推理判断(比如叠加场景图分析)。借助这一系列工具,新式的检测思维链可以自动化地将复杂任务拆解为若干简单子任务,对预测结果进行诊断,并有条不紊地规划边界框精修步骤。实验证明,无论是在广泛的各种检测任务中,还是在极具挑战性的难题上,我们的框架都展现出显著效果。相较于当前最先进的方法,搭载了 DetToolChain 的 GPT-4V 在 MS COCO 新类别集的开放词汇检测任务上提升了 +21.5% 的 AP50,在 RefCOCO val 集的零样本指示理解任务上提高了 +24.23% 的准确率,在 D-cube 完整设置下的描述对象检测任务上也实现了 +14.5% 的 AP 提升。 原文链接:[\[2403.12488\] DetToolChain: A New Prompting Paradig...](https://arxiv.org/abs/2403.12488 "[2403.12488] DetToolChain: A New Prompting Paradig...") #arXiv论文# #LLM应用# #计算机视觉# 展开全部 ![](https://yg9538.kmgy.top/img/2024/03/30/2024-03-30_230701_2282550.04046317107909503.jpeg) arXiv论文 LLM应用 计算机视觉
yg9538
2024年3月30日 23:07
转发文档
收藏文档
上一篇
下一篇
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码