亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

WorkflowLLM: Enhancing Workflow Orchestration Capability of Large Language Models

编配 工作流程 计算机科学 软件工程 过程管理 业务 数据库 艺术 视觉艺术 音乐剧
作者
Song Fan,Xin Cong,Yan Fu,Zhang Zhong,Shuyan Zhang,Yuanwei Liu,Yesai Wu,Yankai Lin,Zhiyuan Liu,Maosong Sun
出处
期刊:Cornell University - arXiv
标识
DOI:10.48550/arxiv.2411.05451
摘要

Recent advancements in large language models (LLMs) have driven a revolutionary paradigm shift in process automation from Robotic Process Automation to Agentic Process Automation by automating the workflow orchestration procedure based on LLMs. However, existing LLMs (even the advanced OpenAI GPT-4o) are confined to achieving satisfactory capability in workflow orchestration. To address this limitation, we present WorkflowLLM, a data-centric framework elaborately designed to enhance the capability of LLMs in workflow orchestration. It first constructs a large-scale fine-tuning dataset WorkflowBench with 106,763 samples, covering 1,503 APIs from 83 applications across 28 categories. Specifically, the construction process can be divided into three phases: (1) Data Collection: we collect real-world workflow data from Apple Shortcuts and RoutineHub, transcribing them into Python-style code. We further equip them with generated hierarchical thought via ChatGPT. (2) Query Expansion: we prompt ChatGPT to generate more task queries to enrich the diversity and complexity of workflows. (3) Workflow Generation: we leverage an annotator model trained on collected data to generate workflows for synthesized queries. Finally, we merge the synthetic samples that pass quality confirmation with the collected samples to obtain the WorkflowBench. Based on WorkflowBench, we fine-tune Llama-3.1-8B to obtain WorkflowLlama. Our experiments show that WorkflowLlama demonstrates a strong capacity to orchestrate complex workflows, while also achieving notable generalization performance on previously unseen APIs. Additionally, WorkflowBench exhibits robust zero-shot generalization capabilities on an out-of-distribution task planning dataset, T-Eval. Our data and code are available at https://github.com/OpenBMB/WorkflowLLM.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
juliar完成签到 ,获得积分10
1分钟前
zhong完成签到 ,获得积分10
1分钟前
Copyright应助科研通管家采纳,获得10
1分钟前
科研通AI6.3应助小次采纳,获得10
1分钟前
lovelife完成签到,获得积分10
2分钟前
稳重的元瑶完成签到,获得积分10
2分钟前
2分钟前
肥肉叉烧发布了新的文献求助10
2分钟前
3分钟前
万吉发布了新的文献求助10
3分钟前
3分钟前
sissiarno完成签到,获得积分0
3分钟前
Copyright应助科研通管家采纳,获得10
3分钟前
忧郁如柏完成签到,获得积分10
3分钟前
4分钟前
Kypsi完成签到,获得积分10
4分钟前
4分钟前
小次发布了新的文献求助10
4分钟前
Sundstein完成签到,获得积分10
4分钟前
fouli发布了新的文献求助10
4分钟前
小次完成签到,获得积分10
5分钟前
直率的笑翠完成签到 ,获得积分10
6分钟前
casey完成签到 ,获得积分10
8分钟前
8分钟前
fouli发布了新的文献求助10
8分钟前
9分钟前
肥肉叉烧发布了新的文献求助10
9分钟前
9分钟前
liyang999发布了新的文献求助10
9分钟前
10分钟前
liyang999发布了新的文献求助10
10分钟前
11分钟前
liyang999发布了新的文献求助10
11分钟前
11分钟前
liyang999发布了新的文献求助10
11分钟前
12分钟前
liyang999发布了新的文献求助10
12分钟前
漂流瓶完成签到,获得积分20
13分钟前
13分钟前
13分钟前
高分求助中
Principles of Economics, 11th Edition 10000
Prescott's Microbiology: 2026 Release ISE 10000
University Physics with Modern Physics, 16th edition 10000
Cronologia da história de Macau 5000
Merrill's Atlas of Radiographic Positioning and Procedures - 3-Volume Set, 16th Edition 2000
Interactions of Vowel Quality and Prosody in East Slavic 1000
Erwählung und Berufung bei Paulus: Bedeutung, Entwicklung und Funktion einer Vorstellung in ihrem frühjüdischen und griechisch-römischen Kontext 850
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 内科学 物理 复合材料 催化作用 细胞生物学 无机化学 光电子学 物理化学 电极 基因
热门帖子
关注 科研通微信公众号,转发送积分 7143733
求助须知:如何正确求助?哪些是违规求助? 8791160
关于积分的说明 18580457
捐赠科研通 6735469
什么是DOI,文献DOI怎么找? 3156886
关于科研通互助平台的介绍 2286138
邀请新用户注册赠送积分活动 2131289