视觉和语言VL社区-CSDN社区云

社区首页 (3643)

我加入的社区

我管理的社区

官方推荐社区 76

其他社区 3643

请编写您的帖子内容

社区频道(7)

显示侧栏

卡片版式

全部

VQA

VLN

NLP

CV

博文收录

Ada助手

最新发布

最新回复

标题

阅读量

内容评分

精选

weixin_45206717 2024-03-26

图像识别这条线。。

求教大佬，怎么识别这条线。求代码，，，，，，，，，，，，，

...全文

281

评分

3

龙腾亚太-人工智能技术咨询与培训 2024-01-22

计算机视觉设计如何应用于人脸识别技术？

详细在工信部工业与信息化部电子工业标准化研究院颁发的证书：《计算机视觉处理设计开发工程师》中级2024年1月24日至28日-北京的培训课程中我们可以学到。

...全文

170

评分

回复

龙腾亚太-人工智能技术咨询与培训 2024-01-22

计算机视觉工程师就业前景如何?

非常广阔计算机视觉作为一门快速发展的技术领域，其就业前景非常广阔。以下是对计算机视觉就业前景的分析：

...全文

366

评分

回复

龙腾亚太-人工智能技术咨询与培训 2023-12-22

人工智能证书：《计算机视觉处理设计开发工程师》课程，看有没有想学的！

以下是人工智能证书《计算机视觉处理设计开发工程师》学习的课程内容，人工智能证书是以课程培训和项目实操为主，尤其是工程师证书系列，是完全对照人工智能企业技术标准制定的课程内容。学习时间：2024年1月24日至28日-北京看大家有没有想学习的！

...全文

272

评分

回复

优质创作者: 人工智能技术领域

2022-09-30

VALSE2022天津线下参会个人总结8月24日-3

8月24日的学生论坛我也是偶尔之间注意到的，真的得感谢我的运气和VALSE组委会，虽然没法参加上午的Workshop，但是学生论坛的帮助更甚。太感谢VALSE了，让我能亲眼见到只在视频中出现的人物，Swim-Transformer 的一作刘泽，FCOS的一作田值，RepVGG的一作丁霄汗，南航的刘偲老师（在2020年的CSIG云课堂上见过）。.........

...全文

190

评分

回复

优质创作者: 人工智能技术领域

2022-09-30

VALSE2022天津线下参会个人总结8月23日-2

第一天晚上买了杯猕猴桃味的蜜雪冰城，今天第二天，住的酒店有点远，得起早点咯。

...全文

174

评分

回复

优质创作者: 人工智能技术领域

2022-09-30

VALSE2022天津线下参会个人总结8月22日-1

非常幸运也很感谢VALSE给了我这样一个能线下参加的机会，遇到了很多的业界大佬，特别是深度学习领域一些大牛导师和一些代表作的一作们，他们的演讲给予我很多启发与见识，与大牛导师/作者的面对面交流更是让我激动不已。........................

...全文

178

评分

回复

优质创作者: 人工智能技术领域

2022-09-30

DETR系列之 MDETR - Modulated Detection for End-to-End Multi-Modal Understanding 论文笔记

时隔几个月没完整地写一篇论文笔记了，下一个目标，开始行动了。前排提出，这篇文章的结构、布局、语言不太合理。

...全文

182

评分

回复

优质创作者: 人工智能技术领域

2022-09-30

新的方式 E2EC: An End-to-End Contour-based Method for High-Quality High-Speed Instance Segmentation 论文笔记

忙的不是很彻底，继续看论文撸代码，找找灵感。这篇论文主要针对实例分割中的标签做了优化，列举了之前的 Polar Mask，LSNet，Deep snake 等方法的优缺点。提出自己的方法，确实很有新意。这篇文章写的也比较好，实验很是充分，是篇好文章。

...全文

205

评分

回复

优质创作者: 人工智能技术领域

2022-09-30

【无标题】

目前的人工智能技术太强了，比如说人脸生成，都能做到以假乱真的地步，还有虚拟化妆之类的，很难用肉眼判断出来是否采用了人工智能技术，这对于那些不知情的“榜一大哥”绝对是个头疼的问题。另外，由于某些人的居心，利用大模型来生成一些邪恶的事物也是够够的，之前都有消息爆出来，公开搞yellow。真正的技术是对人类的发展进程是有益的，虽然人工智能的发展目前看来还是不够成熟，缺少足够的法律约束，等等问题都没有解决。但不可否认地是，我们在用的手机，电脑等这些电子设备或多或少都含有人工智能的影子在其中，这也是大势所趋。

...全文

193

评分

回复

领域专家: 后端开发技术领域

2022-04-20

MyBatis入门到精通——Mybatis入门篇

一、什么是 MyBatis？MyBatis 是一款优秀的持久层框架，它支持自定义 SQL、存储过程以及高级映射。MyBatis 免除了几乎所有的 JDBC 代码以及设置参数和获取结果集的工作。MyBatis 可以通过简单的 XML 或注解来配置和映射原始类型、接口和 Java POJO（Plain Old Java Objects，普通老式 Java 对象）为数据库中的记录。二、入门案例（1）创建maven项目在此之前，需要提前配置好java环境变量和maven环境变量。..

...全文

193

评分

回复

领域专家: 后端开发技术领域

2022-04-20

编写python代码估算sin(x)的值

请编写一个程序迭代求解sin(x),迭代公式为sin(x)=x/1-x^3!+x^5/5!-x^7/7!+...+(-1)^(2n-1)/(2n-1)!,当n项的值小于10^-5时结束，x为弧度。要求输入x的值，输出相应的结果。【注意】迭代公式中的^代表幂运算。并且输入和输出各占一行，输出结果保留4位小数；运行效果如下所示。【运行结果】输入（一行）：1.57输出（一行）：1.0000一、程序代码#!/usr/bin/python# -*- coding: UTF-8..

...全文

176

评分

回复

优质创作者: 人工智能技术领域

2022-03-30

Anaconda/pip 更换阿里源，助力 conda create -n 虚拟环境搭建

Anaconda/pip 更换为阿里源，助力 conda create -n 虚拟环境搭建

...全文

327

评分

回复

优质创作者: 人工智能技术领域

2022-03-30

胶囊网络之 Found a Reason for me? Weakly-supervised Grounded Visual Question Answering using Capsules论文笔记

这是一篇其他文章里面的参考文献，感觉比较有新意。然后一搜，果然，CSDN 也有一篇博文，但可惜是翻译后的文章，未能满足我的要求，最重要的是没有核心算法框架图与 LaTeX 公式，因此特地再开一篇博文。

...全文

211

评分

回复

优质创作者: 人工智能技术领域

2022-03-13

Visual Question Answering with Textual Representations for Images 论文笔记

Visual Question Answering with Textual Representations for Images 论文笔记一、Abstract二、引言三、方法3.1 Language-only 数据3.1.1 Questions and Answers3.1.2 Image Description3.1.3 Synthetic Data3.2 VQA中的数据增强3.2.1 Hypernym and Hyponym Replacement3.2.2 Color Inversion3.2.3

...全文

194

评分

回复

优质创作者: 人工智能技术领域

2022-03-13

MLP Architectures for Vision-and-Language Modeling: An Empirical Study 笔记

这是一篇实验性质的论文，重点在于结论，这也是笔者第一次接触到这类文章，总体来说，重点关注实验结论，至于实验过程，还是尽量看懂其实验的步骤，无需过度理解。另外，参考文献中的一些文章值得细细阅读，会在博文最后面给出。

...全文

193

评分

回复

优质创作者: 人工智能技术领域

2022-03-13

WeaQA:Weak Supervision via Captions for Visual Question Answering 论文笔记

这是一篇采用弱监督方式解决VQA的文章，与上一篇：Visual Question Answering with Textual Representations for Images 论文笔记有异曲同工之妙，但是这一篇更加花里胡哨一点。前者只采用问题+图像描述作为VQA模型的输入，后者采用图像+视觉字幕的方法取代监督的Q-A问答对，也就是本文标题所说的WeaQA。另外，前者采用的图像描述中包含了视觉字幕，这两者我一开始以为差不多的工作，看完后发现两篇文章都有各自的idea。

...全文

194

评分

回复

优质创作者: 人工智能技术领域

2022-03-13

VQA2021年之后的方向启蒙：Human-Adversarial Visual Question Answering 论文笔记

这是一篇关于VQA数据集的拓展数据集文章，即提出了一种新的数据集Adversarial VQA（AdVQA），也就是对抗性的VQA数据集，该数据集专门收集了SOTA模型不能正确回答的问题，并得出现有VQA模型的能力仍然不足的结论，推荐2021年之后还在研究VQA方向的同学可以深挖。

...全文

200

评分

回复

优质创作者: 人工智能技术领域

2022-03-13

为了统计一切出现在图像上的目标类别的计数：Learning To Count Everything 论文笔记

这是一篇关于目标计数的文章，5月份CVPR出来的时候看过了，这里总结一下，为下一篇做铺垫。代码试过了，比较管用。强推！

...全文

199

评分

回复

视觉和语言VL

12

社区成员

129

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

社区的核心使命：

聚集视觉和语言方向的同学，促进相互交流、分享、借鉴、提升等

社区的注意事项：

正常交流、禁止违法乱纪不道德的发布

社区的激励机制：

暂时没想好