Evaluating Expertise of Concrete Pavement Construction in Modern Large Language Models

计算机科学 工程类 建筑工程 土木工程
作者
Mason Smetana,Igor Sukharev,Lev Khazanovich
出处
期刊:Transportation Research Record [SAGE]
标识
DOI:10.1177/03611981251350643
摘要

State Departments of Transportation (DOTs) are facing workforce shortages and a decline in experienced construction workers. One approach to address this problem is through the active adoption of modern technologies, particularly artificial intelligence (AI) tools. Multimodal large language models (LLMs) offer emerging capabilities, such as instruction following and question answering, making them suitable for numerous practical applications in civil engineering. A key area of interest is effectively communicating complex concepts to train engineers and construction workers; however, there remains a need for a structured approach to selecting appropriate models and evaluating LLMs’ knowledge for specialized engineering areas. This paper presents an evaluation of twenty-six different LLMs using over 100 automatically generated questions, revealing a wide range of accuracies in concrete pavement construction expertise. The proposed methodology uses carefully selected, domain-specific documents and best practices to automatically build a customized framework for assessing model performance in niche fields. It also demonstrates that techniques like the “Retry” method and the integration of domain-specific information through retrieval augmented generation (RAG) can significantly enhance LLM accuracy. The results indicate that open-source, small- and medium-sized models combined with RAG, which can run efficiently on laptop computers, could be deployed for future applications. These techniques show promise for model improvement without additional fine-tuning or retraining, significantly reducing the computational requirements for tailored engineering tasks.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
zyw完成签到 ,获得积分10
2秒前
10秒前
武雨寒发布了新的文献求助10
16秒前
17秒前
风清扬应助科研通管家采纳,获得30
18秒前
风清扬应助科研通管家采纳,获得30
18秒前
18秒前
isedu完成签到,获得积分0
19秒前
张海新完成签到 ,获得积分10
24秒前
我要读博士完成签到 ,获得积分10
26秒前
安详凡完成签到 ,获得积分10
30秒前
夏蓉完成签到,获得积分10
37秒前
Spice完成签到 ,获得积分10
41秒前
优雅含灵完成签到 ,获得积分10
46秒前
听闻韬声依旧完成签到 ,获得积分10
47秒前
47秒前
如意书桃完成签到 ,获得积分10
48秒前
秀丽笑容完成签到 ,获得积分10
49秒前
Lucas应助风华笔墨采纳,获得10
51秒前
lily发布了新的文献求助10
59秒前
wlscj举报yyy求助涉嫌违规
1分钟前
licht完成签到 ,获得积分10
1分钟前
lily完成签到,获得积分10
1分钟前
谢陈完成签到 ,获得积分10
1分钟前
大猪完成签到 ,获得积分10
1分钟前
loren313完成签到,获得积分0
1分钟前
Daisy完成签到,获得积分10
1分钟前
wlscj举报dubo666求助涉嫌违规
1分钟前
lx完成签到 ,获得积分10
1分钟前
王佳亮完成签到,获得积分10
1分钟前
平凡世界完成签到 ,获得积分10
1分钟前
652183758完成签到 ,获得积分10
1分钟前
anz完成签到 ,获得积分10
1分钟前
久晓完成签到 ,获得积分10
1分钟前
rsdggsrser完成签到 ,获得积分10
1分钟前
wlscj举报KJNKNJ求助涉嫌违规
1分钟前
优秀棒棒糖完成签到 ,获得积分10
1分钟前
哆啦十七应助平淡尔琴采纳,获得20
1分钟前
老实的乐儿完成签到 ,获得积分10
1分钟前
甘sir完成签到 ,获得积分10
1分钟前
高分求助中
Encyclopedia of Quaternary Science Third edition 2025 12000
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Social Work Ethics Casebook: Cases and Commentary (revised 2nd ed.). Frederic G. Reamer 800
Beyond the sentence : discourse and sentential form / edited by Jessica R. Wirth 600
Holistic Discourse Analysis 600
Vertébrés continentaux du Crétacé supérieur de Provence (Sud-Est de la France) 600
Vertebrate Palaeontology, 5th Edition 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5336342
求助须知:如何正确求助?哪些是违规求助? 4473852
关于积分的说明 13922132
捐赠科研通 4368464
什么是DOI,文献DOI怎么找? 2400216
邀请新用户注册赠送积分活动 1393384
关于科研通互助平台的介绍 1365017