多模态大语言模型(MLLM)综述:从CLIP到GPT-5的完整技术脉络
/* 全宽覆盖 */ #post { max-width: 100% !important; width: 100% !important; padding: 0 !important; } #post article { max-width: 100% !important; width: 100% !important; padding: 0 !important; } #post .post-content { max-width: 100% !important; width: 100% !important; padding: 0 !important; } .layout { max-width: 100% !important; } #content-inner { max-width: 100% !important; } .aside-content { display: none !important; } #survey-frame { width: 100%; height: calc(100vh - 60px); border:...
用AI写综述:从零到十五页的OpenClaw架构分析论文
今天花了几个小时,用AI助手(小黄Bot)完成了一篇关于OpenClaw开源AI助手平台的综述论文。从最初的构思到最终的中英文两版PDF,整个过程充满了挑战和收获。 背景OpenClaw是一个近年来快速发展的开源个人AI助手平台,它将大型语言模型(LLM)与本地优先执行、多渠道通信相结合。作为一个技术爱好者,我对它的架构设计很感兴趣,决定写一篇综述来系统分析它。 过程第一阶段:英文版IEEE会议论文最初的目标是写一篇符合IEEE会议格式的论文。我们: 使用IEEEtran文档类 搜索了35+篇学术文献(包括arXiv上的OpenClaw专项研究) 创建了TikZ架构图和对比表 从5页扩展到10页 第二阶段:中文版用户要求中文版本,我们尝试了多种方案: ctexart模板:解决了字体问题(使用Noto CJK字体) 自动化学报格式:虽然官方模板无法编译,但用ctex模拟了期刊风格 内容扩充:每节增加到3-4段详细论述 第三阶段:文献收集通过Tavily API搜索arXiv,发现了12篇专门研究OpenClaw的论文: 安全研究:ClawGuard三层风险分类、Doubl...
Hexo公式显示与自动部署
Hexo 安装可以通过访问Hexo了解到安装方式。安装 Hexo 前,需要确保电脑内已安装: Git Node.js (建议更新至最新的 LTS 长期维护版,参考Node.js 版本限制) 非必要选项:代码编辑器(如 VSCode)与 Markdown 编辑器(如 Typora) 可以选择全局安装 1$ npm install -g hexo-cli 或局部安装 1$ npm install hexo 可以通过hexo -v命令查看安装 hexo 版本,验证是否已安装成功。 初始化项目选择一个合适的地方 123$ hexo init <folder>$ cd <folder>$ npm install 其中<folder>是要建立的项目名。 核心目录如下: .├── _config.yml├── package.json├── scaffolds├── source| ├── _drafts| └── _posts└── themes 常用命令有 123456$ hexo clean # 清除生成的缓存$ hexo g # 生...
PyTorch中的一些函数
gather函数形式1torch.gather(input, dim, index, *, sparse_grad=False, out=None) → Tensor 作用沿着由dim指定的轴收集数值 输出结果123out[i][j][k] = input[index[i][j][k]][j][k] # if dim == 0out[i][j][k] = input[i][index[i][j][k]][k] # if dim == 1out[i][j][k] = input[i][j][index[i][j][k]] # if dim == 2 举例12345678910111213141516171819202122232425>>> t = torch.tensor([[1, 2], [3, 4]])>>> torch.gather(t, 1, torch.tensor([[0, 0], [1, 0]]))tensor([[ 1, 1], [ 4, 3]])>>> t = torch.tensor...
Python第三方库yaml
介绍YAML 全称 YAML Ain’t Markup Language,它是一种以数据为中心的标记语言,比 XML 和 JSON 更适合作为配置文件[ref]YAML教程(快速入门版) (biancheng.net)[/ref]。 PyYAML是Python中用于处理YAML的第三方库。 安装1pip install PyYAML PyYAML 6.0要求 Python >=3.6[ref]PyYAML · PyPI[/ref]。 YAML文件后缀xxx.yml 或 xxx.yaml 语法树形结构,相同的前缀只需要写一次 使用 空格缩进 来表示层级关系,空格数不重要,相同层级左对齐即可。不能用tab 使用key: value,:后面要加一个空格(重要) 大小写敏感 #表示注释 其他可参考: yml/yamlyml和yaml木叶二柱子的博客-CSDN博客 YAML 入门教程 | 菜鸟教程 (runoob.com) 其他 Python中使用使用库导入库名为yaml 1import yaml 打开yaml文件假设有test.yaml文件: 123456789一级标题: ...
深度学习相关概念
持续更新 术语backbone翻译为骨干网络的意思,既然说是主干网络,就代表其是网络的一部分,这个主干网络大多时候指的是提取特征的网络,其作用就是提取图片中的信息,供后面的网络使用。 这些网络经常使用的是resnet、VGG等,而不是我们自己设计的网络,因为这些网络已经证明了在分类等问题上的特征提取能力是很强的。在用这些网络作为backbone的时候,都是直接加载官方已经训练好的模型参数,后面接着我们自己的网络。让网络的这两个部分同时进行训练,因为加载的backbone模型已经具有提取特征的能力了,在我们的训练过程中,会对他进行微调,使得其更适合于我们自己的任务。 主要分成三类:\CNNs结构, Transformer结构(如ViT及衍生算法,比如PVT),CNNs+Transformer结构**。深度学习常用的backbone有哪些深度学习backbone万里鹏程转瞬至的博客-CSDN博客 backbone 相关概念还有: Neck:是放在backbone和head之间的,是为了更好的利用backbone提取的特征。 Bottleneck:瓶颈的意思,通常指的是网网络输入的...
Linux的文件权限
查看文件直接使用ls命令查看。 输出结果为code test.txt。 但是,部分文件是隐藏文件,这时候就需要使用ls -a命令查看。其中,以.开头的就代表是隐藏文件(夹)。 1234huii@HUII-PC:~$ ls -a. .bash_logout .config .local .python_history .viminfo test.txt.. .bashrc .dbus .motd_shown .ssh .vscode-server.bash_history .cache .lesshst .profile .sudo_as_admin_successful code 可以使用ls -l命令查看文件属性。 1234huii@HUII-PC:~$ ls -ltotal 8drwxr-xr-x 6 huii huii 4096 Feb 17 13:47 code-rw-r--...
YOLOv3笔记
学习内容来源:同济子豪兄的个人空间_哔哩哔哩_bilibili 响应时间图 响应时间图2 骨干网络Darknet-53 网络结构【目标检测】YOLOV3详解_Aliert的博客-CSDN博客 结构 13*13的anchor负责预测大物体; 26*26的anchor负责预测中物体; 52*52的anchor负责预测小物体;
YOLOv2(YOLO9000)笔记
学习内容来源:同济子豪兄的个人空间_哔哩哔哩_bilibili 作者:Joseph Redmon, Ali Farhadi9000:九千多个类 相比于v1,v2添加了anchor,batch normalization,多尺度训练等。 模型演进 YOLOv1缺点 准确度低 定位性能差 recall低(检测出全部目标能力) 检测小目标、密集目标差 Batch Normalization批标准化强行将神经元的输出集中到0附近。 BatchNorm就是在深度神经网络训练过程中使得每一层神经网络的输入保持相同分布。 Batch normalization 的 batch 是批数据, 把数据分成小批小批进行随机梯度下降 ,而且在每批数据进行前向传递 的时候, 对每一层都进行 normalization的处理,。在全连接层和激励曾之间加入BN层。 在神经网络中, 数据分布对训练会产生影响. 比如某个神经元 x 的值为1, 某个 Weights 的初始值为 0.1, 这样后一层神经元计算结果就是 Wx = 0.1; 又或者 x = 20, 这样 Wx 的结果就为 2。现在还不能看出什么...
Python小tips【持续更新】
默认参数参考:【Python】我精心设计的默认参数,怎么就出问题了呢?_哔哩哔哩_bilibili 在定义类的时候,会定义一些默认参数,可能会像这样 1234class Player: def __init__(self, name, items=[]): self.name = name self.items = items 然后如果像这样调用的话 123456789if __name__ == "__main__": p1 = Player("John", ["sword", "shield"]) p2 = Player("Jane") p3 = Player("Jack") p2.items.append("bow") p3.items.append("axe") print(p3.items) 输出结果为['bow', '...





