百度百科的简介

TouchDesigner 是一个可视化编程的开发平台,可以创建实时的视觉及新媒体创作,主要用于实时交互新媒体创作。其应用场景包括:创建可互动的新媒体系统、建筑投影、VJ,还是快速的制作创意原型等等。
因为其提供一种基于节点式的可视化编程环境。不用敲代码,通过创建节点并且连线,就可以创作出视觉出彩的作品。
TouchDesigner 功能元件主要分为6大类:COMP, TOP, CHOP, SOP, DAT, MAT,对于不同方向的运用。比如TOP内的控制器主要用于处理图像及影像,而SOP内的控制器主要用于3D的处理。
TouchDesigner 现支持 Windows、Mac OS 两种系统。


两个主要网站

阅读全文

官网:Digital worlds that feel human | Ultraleap

面对开发人员的网页:Leap Motion Developer

对比:Tracking | Ultraleap Stereo IR 170 Evaluation Kit | Ultraleap

Stereo IR 170 Camera Module 开发板
Stereo IR 170 Camera Module 开发板

 

开发板与 leap motion 的功能对比
开发板与 leap motion 的功能对比

 

本文转载自:http://objectdetection.cn/2020/07/01/%e8%ae%a1%e7%ae%97%e6%9c%ba%e8%a7%86%e8%a7%89%e6%96%b0%e6%89%8b%e6%8c%87%e5%8d%97/

此文由 http://objectdetection.cn/ 翻译自 英语文章 Beginner’s Guide to Computer Vision

谢谢 objectdetection.cn 的分享,若有侵权或不当转载请联系我:tahoroom@163.com


通过机器的眼睛去探索

  • 如果我们想让机器学会思考,就需要教他们学会如何用视觉去看周围环境。—— 斯坦福大学AI实验室和斯坦福视觉实验室主任李飞飞

使计算机或手机等机器看到周围环境的现象称为计算机视觉。机器仿生人眼的研究工作可以追溯到50年代,从那时起,我们已经走了很长一段路。计算机视觉技术已经通过不同的电子商务领域以及相机应用程序进入了我们的手机。
想一想当机器能够像人眼一样准确地看到周围环境时,机器还有什么是不可以做的。人眼是一个复杂的结构,它可以理解复杂的环境现象。同样的,可以让机器能够看到事物并使其具有足够的能力去理解它们所看到的内容,从而进一步对其进行分类,这项工作仍然是非常艰巨。
使用计算机视觉等效其准确性几乎与人眼相同的情况下,可以在眨眼间就进行数百万次计算。这不仅涉及到将图片转换为像素,还包括尝试通过这些像素去了解图片中的内容,接下来你将首先来了解如何从这些像素中提取信息并理解其代表的内容。


 

那么,让我们了解一下机器如何去看(像人眼一样)?
A. 用数字表示颜色:在计算机科学中,每种颜色都由指定的十六进制值来表示。机器通过这种编码方式,来了解图像像素是由什么颜色组成的。而作为人类,我们天生就拥有基因来区分不同色调。

B. 图像分割:使计算机识别出相似的颜色组,然后分割图像,即将前景与背景区分开。颜色渐变技术被用来查找不同对象的边缘。

C. 查找角点:分割后,查找图像中的某些特征,也称为角点(corners)。简而言之,算法会搜索以一定角度相交的线,并以一种颜色的阴影覆盖图像的特定部分。角点(也称为特征)构建基块,可帮助查找图像中包含的更详细信息。

D. 查找纹理:确定图像中的纹理是正确识别图像的另一个重要因素。两个对象之间的纹理差异使机器正确地对对象进行更容易地分类。

E. 做出猜测:执行上述步骤后,机器需要做出接近正确值的预测或者推断,并将图像与数据库中存在的图像进行匹配。

F. 最后,看大图!最后,一台机器会看到更大、更清晰的画面,并根据所提供的算法指令检查是否正确地识别了该画面。在过去的几年中,准确性得到了很大的提高,但是当机器被要求处理带有混合物体的图像时,机器仍然会犯错误。

拥有计算机视觉研究小组的大学:

美国大学

卡内基梅隆大学机器人学院
加州大学洛杉矶分校
北卡罗来纳大学教堂山分校
华盛顿大学
加州大学伯克利分校
斯坦福大学
麻省理工学院
康奈尔大学
宾夕法尼亚大学
加州大学尔湾分校
哥伦比亚大学
伊利诺伊大学香槟分校
南加州大学
密西根大学
普林斯顿大学
罗切斯特大学
德克萨斯大学奥斯汀分校
马里兰大学学院公园
布朗大学
中央佛罗里达大学
纽约大学
密西根州立大学
麻省大学,阿默斯特
西北大学
加州大学圣地亚哥分校

加拿大的大学:

艾伯塔大学
多伦多大学
不列颠哥伦比亚大学
西蒙弗雷泽大学

欧洲大学:

INRIA法国
牛津大学
苏黎世联邦理工学院
德国马克斯·普朗克研究所
爱丁堡大学
萨里大学
弗莱堡大学
瑞典KTH
德累斯顿大学
达姆施塔特工业大学
瑞士EPFL
鲁汶大学
巴塞罗那计算机视觉中心
瑞士IDIAP
伦敦帝国理工学院
海德堡国际机场
曼彻斯特大学
波恩大学
亚琛工业大学
阿姆斯特丹大学
慕尼黑工业大学
捷克技术大学
剑桥大学
格拉茨
IST奥地利
伦敦玛丽皇后大学
苏黎世大学
代尔夫特大学
利兹大学
伯尔尼大学
隆德大学
意大利特伦托大学
意大利佛罗伦萨大学
斯图加特大学
萨尔大学
巴黎中央学校
巴黎理工学院
奥卢大学
卡尔斯鲁厄理工学院

如果你是计算机视觉领域的新手,可以在下面找到一系列初学者需要了解的基础知识点。

A.初学者水平
数学:

图像处理:

B.高级水平

要获得有关理论和技术(尤其是算法)的实践知识,请从计算机视觉的角度开始学习OpenCV:

提示:使用C,C ++,Python进行编程时,我们使用OpenCV库进行计算机视觉的相关实践任务。在MATLAB中进行编程时,我们使用计算机视觉系统工具箱(https://in.mathworks.com/products/computer-vision.html?s_tid=gn_loc_drop) 。
同样,如果你使用其他语言编程,则还需要更多的开源库。

你还应该了解领域中科学研究的关键工作,在这里你可以从中学习它们:

必读书籍清单包括:

入门级:

  1. 计算机视觉:算法与应用
  2. 计算机视觉:现代方法David A. Forsyth,Jean Ponce
  3. 计算机视觉中的多视图几何。作者:Richard Hartley,Andrew Zisserman

高级水平—走向深度学习

  1. Michael Nielsen的“神经网络和深度学习”在线书;这是一个非常棒而温和的介绍:神经网络和深度学习
  2. Ian Goodfellow,Yoshua Bengio和Aaron Courville撰写的深度学习书

当机器可以感觉到你的情绪时会发生什么?点击链接观看视频
https://youtu.be/QFk3e5PcK7s

TED观看演讲:

  1. 李飞飞:我们如何教计算机理解图片
  2. BlaiseAgüera和Arcas:PhotoSynth如何连接世界图像
  3. 浅川千惠子:新技术如何帮助盲人探索世界
  4. 詹妮弗·希利:如果汽车可以说话,则事故可以避免
  5. 戈兰·莱文(Golan Levin):回望你的艺术
  6. Paul Debevec:制作真实照片的数字脸动画
  7. 戈兰·莱文:软件艺术

在线课程:

入门级:

高级水平—走向深度学习

讲座课程:

全球项目


a. 微软计算机科学家和研究人员正在努力“解决”癌症

另一种让你自己了解计算机视觉领域正在进行的研究的方法是跟随作者并阅读他们在顶级会议上的论文,如CVPR、ICCV、ECCV、BMVC。

与专家的对话

以下交谈摘录是我与两位对计算机视觉领域充满热情的专家交谈的。

与Devi Parikh教授的对话| Facebook AI Research的客座研究员| 佐治亚理工学院(以前是弗吉尼亚理工学院)助理教授

计算机视觉是人工智能的一个子领域,其目标是构建可复制人脑视觉的智能计算机。机器学习是教机器学习的通用术语,但是计算机视觉专门处理视觉数据。在机器学习中,我们更多地使用了统计工具,而计算机视觉同时使用了统计工具和非统计工具。例如,计算机视觉领域的3D重建任务中使用机器学习工具的频率要比图像分类和对象识别等技术要低。许多计算机视觉任务都有其自己的需求,我们为此开发了特定的机器学习工具。
对于任何想开始学习该领域的学生,我建议他们通过研究人员的网页来选择他们感兴趣的问题来学习。大多数情况下,人们都在研究最前沿的问题,这些问题可以从该网页获得可用的标准数据集。他们可以选择一个研究问题,一个数据集以及一个他们可能想使用的库,然后动手去做。
在攻读硕士或博士学位的学生,我通常会去寻找有责任心,积极性和决心的来作为我的学生。为了使你的基本概念清晰明了,可以尝试阅读研究论文,尝试了解全世界研究人员正在研究的AI前沿问题。

B.与Richa Agrawal的对话 | 宾夕法尼亚大学校友| Whodat的计算机视觉研究工程师

我毕业于斋浦尔MNIT,在那学习期间,我与Robotics研究组取得了联系,我们合作实现了一些项目,然后参加IIT Roorkee的国家级比赛并赢得了比赛,这段经验极大地鼓舞了我。完成学士学位后,我开始在Yahoo工作,我意识到这不是我想要做的事,因此去了宾夕法尼亚大学攻读硕士学位。攻读硕士学位的这段时间,我通过学习不同的课程探索了不同的研究领域,并最终决定将计算机视觉作为我的主要研究方向。毕业后,我在美国的一家初创公司工作,并希望在印度寻找计算机视觉的就业机会。在Whodat(一家基于Bangalore的计算机视觉初创公司)中,我们使用增强现实和可视化技术对图像进行研究处理。比如,你打算为自己的房屋购买家具,你针对家庭的布局环境去商店后选择了一家家具店,但在家具交付后,常常会出现家具太大或太小的问题,现在没有什么技术可以解决该问题。我们正在尝试通过构建一个解决方案来帮助你,该解决方案可以使商店的家具在你家中进行可视化布置。这将使你能够做出更好的决定,并轻松地购买物品。
在学习时,很多时候我无法尽力而为,经常感到沮丧,但后来朋友的建议来了。他告诉我-“只有少数人(不到0.1%)能够做到这一点(在国外读硕士和在计算机视觉等技术领域有如此研究),并且而你正是其中之一。而且你如果加倍努力,你自己可以做到其它人做不到的东西。

对于学生入门的一些建议,在与其他学院同龄人的交谈之后,我建议你参加比赛和黑客马拉松。重要的是要找到自己的兴趣,而不是在自己不喜欢的地方工作。例如,计算机视觉在印度是一个广阔的领域,在印度有广阔的发展空间,在这个领域,你所需要的只是一架已经开始渗透到更小的城市的相机。因此,计算机视觉的未来绝对是光明的。

本文原链接:http://objectdetection.cn/2020/07/01/%e8%ae%a1%e7%ae%97%e6%9c%ba%e8%a7%86%e8%a7%89%e6%96%b0%e6%89%8b%e6%8c%87%e5%8d%97/

原文链接:https://medium.com/readers-writers-digest/beginners-guide-to-computer-vision-23606224b720

原文来自:微信公众号 OpenCV学堂 2019-09-06 文章Github上星标超过7000+的OpenCV开发教程


大家好,学习OpenCV大家最想知道的就是从哪里可以找到好的学习资料,今天就介绍一位多年计算机视觉与机器学习开发经验的博士,知名技术作者、写过超过1000+篇的OpenCV技术文章,通俗易懂,堪称OpenCV神人-Satya Mallick,他也是知名网站learnopencv的主人与唯一作者。怎么形容他都不为过,可以说是OpenCV案例代码大全、里面有很多很有参考价值的代码片段与学习案例,无论是初学者还是有经验的OpenCV开发者,看完之后都会从中受益。前提是认真看代码,如果还读不懂代码,建议先补一波基础知识比较好。什么也不多说啦!神人全部教程与源码的github地址如下:

https://github.com/spmallick/learnopencv

代码知识点列表

代码内容主要覆盖如下知识点:

OpenCV基础代码演示
OpenCVa
OpenCV 深度神经网络模块代码演示
人脸相关主要包括
-人脸检测
-人脸识别
-人脸交换
-人脸迁移
-人脸landmark
手势检测
图像分类与对象检测
Keras基础教程包括模型训练、迁移学习
多对象跟踪演示
Pytorch基础教程
Pytorch高级教程(包括对象检测,图像分类等)
YOLOv3模型训练与使用

部分源代码列表如下:

Satya Mallick简历
博士毕业、数十年的计算机视觉与机器学习开发经验、精通OpenCV、Caffe、pytorch等开发框架、2019年OpenCV官方视频教程开发者,不过他的视频教程是收费美刀的!
Satya Mallick个人网站 https://www.learnopencv.com/

“An open source machine learning framework that accelerates the path from research prototyping to production deployment.”

官网:https://pytorch.org/

简介(来自百度百科)

PyTorch是一个开源Python机器学习库,基于Torch,用于自然语言处理等应用程序。
2017年1月,由Facebook人工智能研究院(FAIR)基于Torch推出了PyTorch。它是一个基于Python的可续计算包,提供两个高级功能:1、具有强大的GPU加速的张量计算(如NumPy)。2、包含自动求导系统的深度神经网络。
PyTorch的前身是Torch,其底层和Torch框架一样,但是使用Python重新写了很多内容,不仅更加灵活,支持动态图,而且提供了Python接口。它是由Torch7团队开发,是一个以Python优先的深度学习框架,不仅能够实现强大的GPU加速,同时还支持动态神经网络,这是很多主流深度学习框架比如Tensorflow等都不支持的。
PyTorch既可以看作加入了GPU支持的numpy,同时也可以看成一个拥有自动求导功能的强大的深度神经网络。除了Facebook外,它已经被Twitter、CMU和Salesforce等机构采用。
优点:
  • PyTorch是相当简洁且高效快速的框架
  • 设计追求最少的封装
  • 设计符合人类思维,它让用户尽可能地专注于实现自己的想法
  • 与google的Tensorflow类似,FAIR的支持足以确保PyTorch获得持续的开发更新
  • PyTorch作者亲自维护的论坛 供用户交流和求教问题
  • 入门简单 [2]
  • 一台PC设备、一张高性能NVIDIA显卡(可选)、Ubuntu系统即可满足环境搭建。

知乎问答:PyTorch到底好用在哪里?

答:https://www.zhihu.com/question/65578911/answer/565574377