亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Leveraging Vision-Language Models for Manufacturing Feature Recognition in CAD Designs

计算机辅助设计 特征(语言学) 工程制图 计算机科学 计算机辅助设计 特征识别 机器视觉 人工智能 计算机视觉 自然语言处理 模式识别(心理学) 工程类 语言学 操作系统 哲学
作者
Muhammad Tayyab Khan,Lequn Chen,Ye Han Ng,Wenhe Feng,Nicholas Yew Jin Tan,Seung Ki Moon
出处
期刊:Journal of Computing and Information Science in Engineering [ASM International]
卷期号:: 1-17
标识
DOI:10.1115/1.4069266
摘要

Abstract Automatic feature recognition (AFR) is essential for transforming design knowledge into actionable manufacturing information. Traditional AFR methods, which rely on predefined geometric rules and large datasets, are often time-consuming and lack generalizability across various manufacturing features. To address these challenges, this study investigates vision-language models (VLMs) for automating the recognition of a wide range of manufacturing features in CAD designs without extensive training datasets or predefined rules. Instead, prompt engineering techniques, such as multi-view query images, few-shot learning, sequential reasoning, and chain-of-thought, are applied to enable recognition. The approach is evaluated on the proposed CAD dataset containing designs of varying complexity relevant to machining, additive manufacturing, sheet metal forming, molding, and casting. Five VLMs, including three closed-source models (GPT-4o, Claude-3.5-Sonnet, and Claude-3.0-Opus) and two open-source models (LLava and MiniCPM), are evaluated on this dataset with ground truth features labeled by experts. Key metrics include feature quantity accuracy, feature name matching accuracy, hallucination rate, and mean absolute error (MAE). Results show that Claude-3.5-Sonnet achieves the highest feature quantity accuracy (74%) and name matching accuracy (75%) with the lowest MAE (3.2), while GPT-4o records the lowest hallucination rate (8%). In contrast, open-source models have higher hallucination rates (>30%) and lower accuracies (<40%). This study demonstrates the potential of VLMs to automate feature recognition in CAD designs within diverse manufacturing scenarios.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
4秒前
量子星尘发布了新的文献求助10
9秒前
34秒前
51秒前
狂吃6碗饭发布了新的文献求助10
57秒前
SciGPT应助科研通管家采纳,获得30
58秒前
科研通AI2S应助科研通管家采纳,获得10
58秒前
狂吃6碗饭完成签到,获得积分10
1分钟前
1分钟前
越幸运完成签到 ,获得积分10
2分钟前
量子星尘发布了新的文献求助10
2分钟前
Cell完成签到 ,获得积分10
2分钟前
2分钟前
干净涵梅发布了新的文献求助10
2分钟前
SDS完成签到 ,获得积分10
2分钟前
科研通AI2S应助Pattis采纳,获得10
2分钟前
冬去春来完成签到 ,获得积分10
2分钟前
脑洞疼应助科研通管家采纳,获得30
2分钟前
3分钟前
3分钟前
Qyyy发布了新的文献求助10
3分钟前
小新小新完成签到 ,获得积分10
3分钟前
充电宝应助Qyyy采纳,获得10
3分钟前
量子星尘发布了新的文献求助20
3分钟前
上官枫完成签到 ,获得积分10
3分钟前
4分钟前
Qyyy发布了新的文献求助10
4分钟前
量子星尘发布了新的文献求助10
4分钟前
5分钟前
jeff发布了新的文献求助10
5分钟前
完美世界应助jeff采纳,获得10
5分钟前
丘比特应助Qyyy采纳,获得10
5分钟前
bkagyin应助大喵采纳,获得10
6分钟前
6分钟前
量子星尘发布了新的文献求助10
6分钟前
6分钟前
科研通AI2S应助科研通管家采纳,获得10
6分钟前
斯文败类应助科研通管家采纳,获得10
6分钟前
hyjcs完成签到,获得积分0
7分钟前
7分钟前
高分求助中
(应助此贴封号)【重要!!请各位详细阅读】【科研通的精品贴汇总】 10000
Voyage au bout de la révolution: de Pékin à Sochaux 700
血液中补体及巨噬细胞对大肠杆菌噬菌体PNJ1809-09活性的影响 500
Methodology for the Human Sciences 500
First Farmers: The Origins of Agricultural Societies, 2nd Edition 500
Simulation of High-NA EUV Lithography 400
Metals, Minerals, and Society 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 4316880
求助须知:如何正确求助?哪些是违规求助? 3835260
关于积分的说明 11994984
捐赠科研通 3475467
什么是DOI,文献DOI怎么找? 1906347
邀请新用户注册赠送积分活动 952399
科研通“疑难数据库(出版商)”最低求助积分说明 853866