MoyiTech 发布的文章 - MoyiTech的小站-IT博客-Maker BLOG-生活需要鼓励

首页大事记友情链接留言板关于

1 解决SSH登录卡在"Last login"问题 1,477 阅读 2 无界拷贝文件在线传输系统开始公测 1,213 阅读 3 宝塔BT面板PHP防CC 1,065 阅读 4 高考作文论证方法之“广深高铁” 567 阅读 5 Linux环境安装Dlib——以Centos7为例 563 阅读

默认分类新鲜科技时事热点

学无止境

Python Arduino 作文素材 C语言踩坑记录机器学习

资源分享站长杂谈

登录

标签搜索

机器学习
Datawhale
C语言
git
python
组队学习
物联网
esp8266
PHP
云顶书院
Linux
LLM
建站
网站
宝塔
开学
清明节
VPS
Arduino
开源硬件

MoyiTech

累计撰写 56 篇文章
累计收到 38 条评论

首页
栏目
页面

搜索到 56 篇与的结果

2023-10-10
Mind2Web: Towards a Generalist Agent for the Web 论文解读主页：https://osu-nlp-group.github.io/Mind2Web训练集：https://huggingface.co/datasets/osunlp/Mind2Web概要本文介绍了一个名为MIND2WEB的数据集，用于开发和评估Web通用代理，可以使用自然语言输入指令，使之可以在任何复杂的网站上执行操作。对比前人缺陷：现有的用于Web代理的数据集要么使用模拟网站，要么仅涵盖有限的网站和任务集，因此不适用于通用的Web代理。本文优势：MIND2WEB数据集包含来自137个网站、跨足31个领域的超过2,000个开放式任务，以及为这些任务收集的众包行动序列。MIND2WEB为构建通用Web代理提供了三个必要的要素：多样化的领域、网站和任务使用真实世界的网站而不是模拟和简化的网站广泛的用户交互模式。基于MIND2WEB，作者进行了首次尝试使用大型语言模型（LLMs）构建通用Web代理。由于真实世界网站的原始HTML通常元素过多无法直接输入LLM，本文的方案为：先通过小型LM进行筛选，再输入到LLM中，可以显著提升模型的效果和效率。MIND2WEB 数据集介绍来自于真实网站的捕捉涵盖领域广网站的快照和交互捕获完全任务定义该数据集旨在使代理通过一系列操作完成特定任务任务描述：是高级的，而不是避免了低级的、一步一步的指令。操作序列：（目标元素，操作）->（目标元素，操作）-> ... ->（目标元素，操作）三种常见操作：点击(包括悬停和按回车)、输入、选择操作序列通常跨越一个站点的多个网页。网页快照：HTML、DOM、HAR等过程信息执行方式：逐步预测、执行，input：当前网页、历史操作，output：接下来的操作（有RNN的意思）数据收集数据通过亚马逊众包平台（Amazon Mechanical Turk）收集，主要分为三个阶段：第一阶段-任务提出：首先要求工作者提出可以在给定网站上执行的任务。作者会仔细审核提出的任务，并选择在第二阶段进行注释的可行且有趣的任务。第二阶段-任务演示：要求工作者演示如何在网站上执行任务。使用 Playwright 开发了一个注释工具，记录交互跟踪并在每个步骤中对网页进行快照。如图 2 所示，用红色标记的操作将导致转换到新网页。第三阶段-任务验证：作者验证所有任务，以确保所有操作都是正确的，任务描述正确地反映了注释的操作。与前人的比较及研究挑战采用真实的网页，更符合实际网页元素多、复杂度高，未进行人工简化任务等级高，更接近日常使用先前的研究通常提供逐步的指令，并主要关注测试代理将低级指令转化为操作的能力，例如，“在位置字段中输入纽约，单击搜索按钮并选择明天标签”本文数据集只提供高级目标，例如，“纽约明天的天气如何？”故这种数据集(Mind2Web)对于代理模型的训练及应用来说提出了很大的挑战。MindAct 框架为了使用Mind2Web数据集，引入了MindAct框架由于原始HTML过大，直接输入到LLM中消耗资源过大，MindAct将此分为二阶段过程（如图三）第一阶段：如图四，使用一个Small LM，从HTML中元素中筛选出几个候选元素第二阶段：将候选元素合并成HTML片段传入到LLM进行最后预测(元素 + 操作)Small LM 用于筛选；LLM用于预测通过Small LM生成小模型feature: Task Description + Previous Actionstarget: Top-k Elements通过LLM预测操作LLM用于判别比生成更有效率故LM被训练为从一系列选项中进行选择，而不是生成完整的目标元素Divide the top-k candidates into multiple clusters of five options. If more than one option is selected after a round,Form new groups with the selected ones. This process repeats until a single element is selected, or alloptions are rejected by the modeltest result：为什么MindAct和两个baseline不使用相同的LLM以控制变量？baseline1: Classfication，仅使用Debertab进行元素预测baseline2: Generation，使用Flan-T5直接进行元素+操作的预测实验实验步骤Test-Cross-Domain：使用不同的域名进行预测Test-Cross-Website：使用同域的网站预测TestCross-Task：使用相同的网站预测数据预处理和评估分别使用Element Accuracy、Operation F1、Step Success Rate、Success Rate对数据进行评估实验结果第一步候选生成使用了微调的DeBERTa 作为Small LM，用于第一步的候选生成（For efficiency, use the base version DeBERTaB with 86M parameters.）分别获得了88.9% / 85.3% / 85.7% 的recall取k=50，即top-50用于下一步预测。第二步操作预测使用Flan-T5作为生成模型尽管是大模型（220M for Flan-T5），但在元素选择方面表现先不佳使用上述MindAct中使用的multi-choice QA formulation方法很有效The best model achieves 52.0% step success rate under Cross-Task setting, and 38.9% / 39.6% when generalizing to unseen websites(Cross-Website) and domains(Cross-Domain).However, the overall task success rate remains low for all models, as the agent often commits at least one error step in most cases.Three Levels of Generalization模型均在Cross-Task表现最佳、但在Cross-Website、Cross-Domain中低于Cross-Task 10%以上。由此可见，对于未见过的环境进行预测是目前最大的问题。在图6中可见，Cross-Website、Cross-Domain中的表现很相近。就此可推断，首要问题在于网站的设计和交互逻辑、而不是域名特性。对于网站之间的一些共同的操作，预训练语言模型已经有了可以解析复杂任务的能力。在具体环境中，将这些知识转化为可操作的步骤仍然是一个相当大的挑战。In-context Learning with LLM分别使用MINDACT的方法在GPT-3.5和GPT-4进行了测试，结果如下：GPT-3.5表现不好，在元素选择正确率上仅有20%GPT-4要稍好一些，与微调过的Flan-T5不相上下，表明用大语言模型在此有很大的潜力但GPT-4运行成本很高，使用较小规模的模型是一个很好的发展方向
- 2023年10月10日
- 292 阅读
- 0 评论
- 1 点赞
2023-09-26
AI线上部署之ChatGLM 使用趋动云的在线Jupyter Notebook部署模型环境配置很简单，直接使用预置的镜像即可环境：Python 3PyTorch代码 + 注释：# cli_demo.py import os import platform import signal from transformers import AutoTokenizer, AutoModel import readline # 从指定路径加载预训练的tokenizer和model，允许信任远程代码 tokenizer = AutoTokenizer.from_pretrained("/gemini/data-2", trust_remote_code=True) model = AutoModel.from_pretrained("/gemini/data-2", trust_remote_code=True).cuda() # 若要支持多显卡，请使用下面两行代码替换上面一行，并根据实际显卡数量设置num_gpus # from utils import load_model_on_gpus # model = load_model_on_gpus("THUDM/chatglm2-6b", num_gpus=2) model = model.eval() # 获取操作系统信息，以便在不同操作系统上清屏 os_name = platform.system() clear_command = 'cls' if os_name == 'Windows' else 'clear' stop_stream = False # 构建用户提示信息，包括对话历史、清空历史和终止程序的说明 def build_prompt(history): prompt = "欢迎使用 ChatGLM2-6B 模型，输入内容即可进行对话，clear 清空对话历史，stop 终止程序" for query, response in history: prompt += f"\n\n用户：{query}" prompt += f"\n\nChatGLM2-6B：{response}" return prompt # 处理终止信号的函数 def signal_handler(signal, frame): global stop_stream stop_stream = True # 主函数 def main(): past_key_values, history = None, [] global stop_stream print("欢迎使用 ChatGLM2-6B 模型，输入内容即可进行对话，clear 清空对话历史，stop 终止程序") while True: query = input("\n用户：") if query.strip() == "stop": # 如果用户输入"stop"，退出程序 break if query.strip() == "clear": # 如果用户输入"clear"，清空对话历史并清屏 past_key_values, history = None, [] os.system(clear_command) print("欢迎使用 ChatGLM2-6B 模型，输入内容即可进行对话，clear 清空对话历史，stop 终止程序") continue print("\nChatGLM：", end="") current_length = 0 # 使用模型进行对话生成 for response, history, past_key_values in model.stream_chat(tokenizer, query, history=history, past_key_values=past_key_values, return_past_key_values=True): if stop_stream: # 如果接收到终止信号，停止对话生成 stop_stream = False break else: print(response[current_length:], end="", flush=True) current_length = len(response) print("") if __name__ == "__main__": main() 命令行模式命令：python ChatGLM2-6B/cli_demo.py最终结果：web模式：需要安装streamlitpip install streamlit然后在命令行使用streamlit运行web_demo2.pystreamlit run web_demo2.py --server.port=77使用streamlit可以很方便地实现web界面，无需html、css、js的知识都可以用 https://zhuanlan.zhihu.com/p/448853407
- 2023年09月26日
- 221 阅读
- 0 评论
- 1 点赞
2023-09-26
循环神经网路 RNN 普通的RNN：小数据集低算力S=f(winXt+b) St=f(WinXt+WSSt−1+b)变种输入序列，单输出单输入，输出序列输入不随序列变化原始的N to N的RNN要求序列等长，然而我们遇到的大部分问题序列都是不等长的，如机器翻译中，源语言和目标语言的句子往往并没有相同的长度。下面介绍RNN最重要的一个变种：N to M。这种结构又叫Encoder-Decoder模型，也可以称之为Seq2Seq模型。从名字就能看出，这个结构的原理是先编码后解码。左侧的RNN用来编码得到c，拿到c后再用右侧的RNN进行解码。得到c有多种方式：长短期记忆网络 LSTMforget gate 遗忘门f1=sigmoid(w1[St−1xt]+b1)input gate 输入门f2=sigmoid(w2[St−1xt]+b2)∗tanh(w2′[St−1xt]+b2′) ct=f1∗ct−1+f2
- 2023年09月26日
- 140 阅读
- 0 评论
- 0 点赞
2023-09-23
AI线上部署之猫狗识别使用趋动云的在线Jupyter Notebook部署模型环境配置很简单，直接使用预置的镜像即可环境：Python 3TensorFlow 2代码 + 注释：import argparse import tensorflow as tf import os parser = argparse.ArgumentParser(description='Process some integers') # 使用argparse创建一个可以解析命令行参数的工具，description为描述信息 parser.add_argument('--mode', default='train', help='train or test') parser.add_argument("--num_epochs", default=5, type=int) # 设置epochs parser.add_argument("--batch_size", default=32, type=int) # 设置batch_seze parser.add_argument("--learning_rate", default=0.001) # 设置learning_rate parser.add_argument("--data_dir", default="/gemini/data-1") parser.add_argument("--train_dir", default="/gemini/output") args = parser.parse_args() # 将解析的结果存储在args中 # 图片的前置处理 def _decode_and_resize(filename, label): image_string = tf.io.read_file(filename) # 从文件中读取 image_decoded = tf.image.decode_jpeg(image_string, channels=3) # 解码jpeg为rgb三通道 image_resized = tf.image.resize(image_decoded, [150, 150]) / 255.0 # 将图片缩放、归一化 return image_resized, label if __name__ == "__main__": train_dir = args.data_dir + "/train" cats = [] dogs = [] for file in os.listdir(train_dir): # 遍历文件夹 if file.startswith("dog"): dogs.append(train_dir + "/" + file) else: cats.append(train_dir + "/" + file) print("dogSize:%d catSize:%d" % (len(cats), len(dogs))) train_cat_filenames = tf.constant(cats[:10000]) # 将文件名列表转化为张量 train_dog_filenames = tf.constant(dogs[:10000]) train_filenames = tf.concat([train_cat_filenames, train_dog_filenames], axis=-1) # axis=-1表示最后一个维度 train_labels = tf.concat([ tf.zeros(train_cat_filenames.shape, dtype=tf.int32), # 猫标为0 tf.ones(train_dog_filenames.shape, dtype=tf.int32) # 狗标为1 ], axis=-1) train_dataset = tf.data.Dataset.from_tensor_slices((train_filenames, train_labels)) # 创建一个dataset train_dataset = train_dataset.map( map_func=_decode_and_resize, num_parallel_calls=tf.data.experimental.AUTOTUNE # 指定为并行调用 ) train_dataset = train_dataset.shuffle(buffer_size=20000) # 打乱 train_dataset = train_dataset.batch(args.batch_size) # 设置batch_size train_dataset = train_dataset.prefetch(tf.data.experimental.AUTOTUNE) # 自动调整并行化程度，使训练时可异步预取数据，减少训练时间 model = tf.keras.Sequential([ # 定义模型网络 tf.keras.layers.Conv2D(32, 3, activation="relu", input_shape=(150, 150, 3)), tf.keras.layers.MaxPool2D(), tf.keras.layers.Conv2D(64, 3, activation="relu"), tf.keras.layers.MaxPool2D(), tf.keras.layers.Conv2D(128, 3, activation="relu"), tf.keras.layers.MaxPool2D(), tf.keras.layers.Conv2D(128, 3, activation="relu"), tf.keras.layers.MaxPool2D(), tf.keras.layers.Flatten(), tf.keras.layers.Dropout(0.5), tf.keras.layers.Dense(512, activation="relu"), tf.keras.layers.Dense(2, activation="softmax") ]) model.compile( optimizer=tf.keras.optimizers.Adam(learning_rate=args.learning_rate), # 定义优化器为Adam loss=tf.keras.losses.sparse_categorical_crossentropy, # 定义损失函数为交叉熵 metrics=[tf.keras.metrics.sparse_categorical_accuracy] # 定义模型评估指标为稀疏分类准确率 ) model.fit(train_dataset, epochs=args.num_epochs) # 开始训练 model.save(args.train_dir) # 保存模型 # 构建测试数据集 test_cat_filenames = tf.constant(cats[10000:]) test_dog_filenames = tf.constant(dogs[10000:]) test_filenames = tf.concat([test_cat_filenames, test_dog_filenames], axis=-1) test_labels = tf.concat([ tf.zeros(test_cat_filenames.shape, dtype=tf.int32), tf.ones(test_dog_filenames.shape, dtype=tf.int32) ], axis=-1) test_dataset = tf.data.Dataset.from_tensor_slices((test_filenames, test_labels)) test_dataset = test_dataset.map(_decode_and_resize) test_dataset = test_dataset.batch(args.batch_size) sparse_categorical_accuracy = tf.keras.metrics.SparseCategoricalAccuracy() # 稀疏分类指标 for images, label in test_dataset: y_pred = model.predict(images) sparse_categorical_accuracy.update_state(y_true=label, y_pred=y_pred) # 更新准确率指标的状态 print("test accuracy:%f" % sparse_categorical_accuracy.result()) # 输出结果训练命令：python $GEMINI_RUN/DogsVsCats.py --num_epochs 5 --data_dir $GEMINI_DATA_IN1/DogsVsCats/ --train_dir $GEMINI_DATA_OUT最终结果：学习心得：由于之前接触的都是pytorch，这次第一次接触了TensorFlow，学习到了很多TensorFlow的api和这次demo简洁优美的代码风格
- 2023年09月23日
- 164 阅读
- 0 评论
- 1 点赞
2023-08-25
Jupyter Notebook添加删除查看kernel 查看 Jupyter notebook kerneljupyter kernelspec list添加kernel# 首先进入道相应环境中 python -m pip install ipykernel python -m ipykernel install --user --name=kernelname --display-name showname # name为创建的文件夹名，showname为jupyter notebook展示的内核名删除jupyter kerneljupyter kernelspec remove kernelname
- 2023年08月25日
- 196 阅读
- 0 评论
- 0 点赞

1
2
3
...
12

MoyiTech

56 文章数

38 评论量

河北省4月23日开学了，已退出决赛圈！
分享歌曲——人家
南方姑娘，你是否爱上了北方？分享歌曲——南方姑娘

人生计时板

最新回复

无界拷贝
2024-10-09

请问：文件上传后多久会被系统自动销毁？
phuogtcrxl
2024-09-22

博主真是太厉害了！！！
jiyouzhan
2024-05-19

这篇文章写得深入浅出，让我这个小白也看懂了！
ccbbp
2023-11-10

这个配置得多少钱啊
Heresy
2023-10-07

太方便了，这个

标签云

Copyright © 2020-2022 MoyiTech. All rights reserved. | 冀ICP备2022003350号-3

已运行 00 天 00 时 00 分 00 秒

RSS MAP