图像 识别这条线。。
社区首页 (3633)




请编写您的帖子内容
社区频道(7)
显示侧栏
卡片版式
全部
VQA
VLN
NLP
CV
博文收录
Ada助手
最新发布
最新回复
标题
阅读量
内容评分
精选

259
评分
3


图像 识别这条线。。
求教大佬,怎么识别这条线。求代码,,,,,,,,,,,,,
复制链接 扫一扫
分享

155
评分
回复


计算机视觉设计如何应用于人脸识别技术?
详细在工信部 工业与信息化部电子工业标准化研究院颁发的证书: 《计算机视觉处理设计开发工程师》中级2024年1月24日至28日-北京 的培训课程中我们可以学到。
复制链接 扫一扫
分享

339
评分
回复


计算机视觉工程师就业前景如何?
非常广阔 计算机视觉作为一门快速发展的技术领域,其就业前景非常广阔。以下是对计算机视觉就业前景的分析:
复制链接 扫一扫
分享

257
评分
回复


人工智能证书:《计算机视觉处理设计开发工程师》课程,看有没有想学的!
以下是人工智能证书《计算机视觉处理设计开发工程师》学习的课程内容,人工智能证书是以课程培训和项目实操为主,尤其是工程师证书系列,是完全对照人工智能企业技术标准制定的课程内容。 学习时间:2024年1月24日至28日-北京 看大家有没有想学习的!
复制链接 扫一扫
分享

181
评分
回复


VALSE2022天津线下参会个人总结8月24日-3
8月24日的学生论坛我也是偶尔之间注意到的,真的得感谢我的运气和VALSE组委会,虽然没法参加上午的Workshop,但是学生论坛的帮助更甚。太感谢VALSE了,让我能亲眼见到只在视频中出现的人物,Swim-Transformer 的一作刘泽,FCOS的一作田值,RepVGG的一作丁霄汗,南航的刘偲老师(在2020年的CSIG云课堂上见过)。.........
复制链接 扫一扫
分享

163
评分
回复


VALSE2022天津线下参会个人总结8月23日-2
第一天晚上买了杯猕猴桃味的蜜雪冰城,今天第二天,住的酒店有点远,得起早点咯。
复制链接 扫一扫
分享

168
评分
回复


VALSE2022天津线下参会个人总结8月22日-1
非常幸运也很感谢VALSE给了我这样一个能线下参加的机会,遇到了很多的业界大佬,特别是深度学习领域一些大牛导师和一些代表作的一作们,他们的演讲给予我很多启发与见识,与大牛导师/作者的面对面交流更是让我激动不已。........................
复制链接 扫一扫
分享

172
评分
回复


DETR系列之 MDETR - Modulated Detection for End-to-End Multi-Modal Understanding 论文笔记
时隔几个月没完整地写一篇论文笔记了,下一个目标,开始行动了。前排提出,这篇文章的结构、布局、语言不太合理。
复制链接 扫一扫
分享

新的方式 E2EC: An End-to-End Contour-based Method for High-Quality High-Speed Instance Segmentation 论文笔记
196
评分
回复


新的方式 E2EC: An End-to-End Contour-based Method for High-Quality High-Speed Instance Segmentation 论文笔记
忙的不是很彻底,继续看论文撸代码,找找灵感。这篇论文主要针对实例分割中的标签做了优化,列举了之前的 Polar Mask,LSNet,Deep snake 等方法的优缺点。提出自己的方法,确实很有新意。这篇文章写的也比较好,实验很是充分,是篇好文章。
复制链接 扫一扫
分享

183
评分
回复


【无标题】
目前的人工智能技术太强了,比如说人脸生成,都能做到以假乱真的地步,还有虚拟化妆之类的,很难用肉眼判断出来是否采用了人工智能技术,这对于那些不知情的“榜一大哥”绝对是个头疼的问题。另外,由于某些人的居心,利用大模型来生成一些邪恶的事物也是够够的,之前都有消息爆出来,公开搞yellow。真正的技术是对人类的发展进程是有益的,虽然人工智能的发展目前看来还是不够成熟,缺少足够的法律约束,等等问题都没有解决。但不可否认地是,我们在用的手机,电脑等这些电子设备或多或少都含有人工智能的影子在其中,这也是大势所趋。
复制链接 扫一扫
分享

188
评分
回复


MyBatis入门到精通——Mybatis入门篇
一、什么是 MyBatis?MyBatis 是一款优秀的持久层框架,它支持自定义 SQL、存储过程以及高级映射。MyBatis 免除了几乎所有的 JDBC 代码以及设置参数和获取结果集的工作。MyBatis 可以通过简单的 XML 或注解来配置和映射原始类型、接口和 Java POJO(Plain Old Java Objects,普通老式 Java 对象)为数据库中的记录。二、入门案例(1)创建maven项目在此之前,需要提前配置好java环境变量和maven环境变量。..
复制链接 扫一扫
分享

169
评分
回复


编写python代码估算sin(x)的值
请编写一个程序迭代求解sin(x),迭代公式为sin(x)=x/1-x^3!+x^5/5!-x^7/7!+...+(-1)^(2n-1)/(2n-1)!,当n项的值小于10^-5时结束,x为弧度。要求输入x的值,输出相应的结果。【注意】迭代公式中的^代表幂运算。并且输入和输出各占一行,输出结果保留4位小数;运行效果如下所示。【运行结果】输入(一行):1.57输出(一行):1.0000一、程序代码#!/usr/bin/python# -*- coding: UTF-8..
复制链接 扫一扫
分享

312
评分
回复


Anaconda/pip 更换阿里源,助力 conda create -n 虚拟环境搭建
Anaconda/pip 更换为阿里源,助力 conda create -n 虚拟环境搭建
复制链接 扫一扫
分享

胶囊网络之 Found a Reason for me? Weakly-supervised Grounded Visual Question Answering using Capsules论文笔记
200
评分
回复


胶囊网络之 Found a Reason for me? Weakly-supervised Grounded Visual Question Answering using Capsules论文笔记
这是一篇其他文章里面的参考文献,感觉比较有新意。然后一搜,果然,CSDN 也有一篇 博文,但可惜是翻译后的文章,未能满足我的要求,最重要的是没有核心算法框架图与 LaTeX 公式,因此特地再开一篇博文。
复制链接 扫一扫
分享

183
评分
回复


Visual Question Answering with Textual Representations for Images 论文笔记
Visual Question Answering with Textual Representations for Images 论文笔记一、Abstract二、引言三、方法3.1 Language-only 数据3.1.1 Questions and Answers3.1.2 Image Description3.1.3 Synthetic Data3.2 VQA中的数据增强3.2.1 Hypernym and Hyponym Replacement3.2.2 Color Inversion3.2.3
复制链接 扫一扫
分享

183
评分
回复


MLP Architectures for Vision-and-Language Modeling: An Empirical Study 笔记
这是一篇实验性质的论文,重点在于结论,这也是笔者第一次接触到这类文章,总体来说,重点关注实验结论,至于实验过程,还是尽量看懂其实验的步骤,无需过度理解。另外,参考文献中的一些文章值得细细阅读,会在博文最后面给出。
复制链接 扫一扫
分享

181
评分
回复


WeaQA:Weak Supervision via Captions for Visual Question Answering 论文笔记
这是一篇采用弱监督方式解决VQA的文章,与上一篇:Visual Question Answering with Textual Representations for Images 论文笔记有异曲同工之妙,但是这一篇更加花里胡哨一点。前者只采用问题+图像描述作为VQA模型的输入,后者采用图像+视觉字幕的方法取代监督的Q-A问答对,也就是本文标题所说的WeaQA。另外,前者采用的图像描述中包含了视觉字幕,这两者我一开始以为差不多的工作,看完后发现两篇文章都有各自的idea。
复制链接 扫一扫
分享

189
评分
回复


VQA2021年之后的方向启蒙:Human-Adversarial Visual Question Answering 论文笔记
这是一篇关于VQA数据集的拓展数据集文章,即提出了一种新的数据集Adversarial VQA(AdVQA),也就是对抗性的VQA数据集,该数据集专门收集了SOTA模型不能正确回答的问题,并得出现有VQA模型的能力仍然不足的结论,推荐2021年之后还在研究VQA方向的同学可以深挖。
复制链接 扫一扫
分享

190
评分
回复


为了统计一切出现在图像上的目标类别的计数:Learning To Count Everything 论文笔记
这是一篇关于目标计数的文章,5月份CVPR出来的时候看过了,这里总结一下,为下一篇做铺垫。代码试过了,比较管用。强推!
复制链接 扫一扫
分享
为您搜索到以下结果:
12
社区成员
129
社区内容





视觉和语言VL
本社区致力于促进研究视觉与语言方向同学的交流、讨论、分享等一些类提升自己的活动!包括但不限于视觉问答VQA、视觉语言导航VLN、图像字幕Image Captionin自然语言处理NLP、计算机视觉CV
复制链接 扫一扫

确定
社区描述
本社区致力于促进研究视觉与语言方向同学的交流、讨论、分享等一些类提升自己的活动!包括但不限于视觉问答VQA、视觉语言导航VLN、图像字幕Image Captionin自然语言处理NLP、计算机视觉CV
加入社区
获取链接或二维码
- 近7日
- 近30日
- 至今
加载中
社区公告
社区的核心使命:
- 聚集视觉和语言方向的同学,促进相互交流、分享、借鉴、提升等
社区的注意事项:
- 正常交流、禁止违法乱纪不道德的发布
社区的激励机制:
- 暂时没想好