幻想有简单的方案只是因为没亲手做过:虚拟女友计划104

Tips:点击图片进入下一页



我,一个低水平程序员,以前曾在发过许多贴来进行编程学习。现在,在看过GATEBOX之后,打算开始自制虚拟女友机器人。(他们没给我广告费)





我的现状就是从来没碰过硬件,单片机,树莓派,摸都没摸过;只会软件编程,水平很低,略懂3D建模,水平超低。


我打算做的成品,虚拟女友,在我一个低水平程序员的设想中,由以下几部分组成:


1.实体。全息投影。


2.外貌设定。3D模型建模。


3.灵魂。能进行最简单的语音交互。我对她说HELLO,她要能对我说HELLO。因此,这里必须涉及语音输入和输出。语音识别有简单的解决方案,也有超复杂我基本不能做到的解决方案。


好了,现在我什么都不会。从第一步开始全是我没做过的东西。我打算记录我学习,犯错,进步,制作的全过程(计划拍成视频),一步一步全部记录下来,力求其他人看了我的过程后如果想要做,能照着做,一直到我卡在某处无法前进为止


虚拟女友计划101--------------------------------------------------------------------


第一步,经过我的搜索,全息投影解决方案有各种各样的。


如果你在国内,打开淘宝,搜索“DIY全息投影”,“手机全息投影”,“3D全息投影”之类,即可找到便宜大碗的产品,需要注意的是,其实这个就是塑料片,如果哪位DIY高手自己能用塑料片做,其实根本都可以不用买。


如果你在美国,打开亚马逊,搜索“hologram”,可以找到比淘宝贵得多但是我没有办法呀的产品解决方案。我于9/19/2018购买了一个,我既不知道好不好用也不知道怎么用,prime是两天寄到,9/21/2018我会收到产品,到底我能不能继续做虚拟女友计划102,我本周五才能知道了。


在我收到之前,我会先收集各种资料,进行有可能进行的学习,至少我现在刚刚知道什么是ARDUINO了。



网友评论:
一个人用空闲时间的话,一般要3~5年才能看到可行的成品。太久了…………


建议找找志同道合者搭一个小团队

争取在3~6个月内做出一个有一定效果的初期版本,

之后去众筹网站,开一个众筹项目,集资来加速想法的落地

国内有做这个的公司啊。

----发送自 OPPO PAFM00,Android 8.1.0
Gatebox了解一下
隔壁论坛曾经有个敏片,你可以找他多多交流,
争取早日出院

谢谢这么替我考虑!已经在找了。

有别的公司做这个成品,淘宝卖的叫琥珀(没给我广告费,所以我为什么要提他们),我在bilibili看到的。所以我没打算卖钱。虽然我打算做的跟那个不一样(如果我的计划可行的话)。

做DIY和学习的乐趣就是乐趣本身吧。
树莓派装个google assistant当灵魂?

大哥,啥意思啊,我第一段写的那个就是gatebox呀?

不明白,你是说我疯了?
楼主,我们来组队吧,我有这个想法。硬件方面的就交给我吧。干巴爹。
有意思,马。楼主加油。
没有老婆就自己制造老婆,落泪了
没做成,能学到独立解决问题的能力也是好的,没准泥潭又出个陌陌呢
可以雇几个死宅24小时在线扮演女友

考虑过,第一还要考虑如何把全息投影设备和树莓派协同在一起;

问题的重点是,我没碰过全息投影设备也没碰过树莓派,只能都买来试试了,还好价格不是上天的那种;

其次,还有一个灵魂的解决方案相对简单作弊(其实也不简单),我还没决定走哪个方案。有可能我会都试试...

谢谢提议!谢谢信息!


谢谢!要是你在洛杉矶就能组,不在的话欢迎将来来看这些软硬件。

DIY和学习都是乐趣啦

你说的很对!很有可能到哪一步会失败。但能学到东西。而且我从中得到很多乐趣。
有什么进度和想法,及时在这里更新,一起讨论,一个人做无聊不说,重要的是找到做的乐趣,有人聊天有人关注,又是自己喜欢的事情,有感觉才能坚持。
加油。

我在中国大陆
我感觉做出来放机箱里挺好

谢谢,我会的

那你更有优势啊,淘宝的硬件又更便宜,你又有硬件背景,你可以自己做一个了,说不定会比我做得还好。我接下来尽量把每一步都写得更清楚,务求不懂的人看完也懂了。

谢谢你的提议!
这样的产品好像已经有了,不知道有没有商业化,另外,这是可以显示投影,不过下一步,“灵魂”,好像还没有?不过,对于只是想要得到影像,不需要AI灵魂的用户来说已经很够了,有需要的大家可以去搜哦~
关注一下,楼主真做出来别忘了更新啊

  -
做出来像amadeus还是像铝朋友,不会破产吗

我这还专门去搜索了什么是amadeus,原来是说amadeus红莉栖ai;不过我没看过石头门0哪
关注关注好像很多童话都会写主角从0开始,钻研了几天就做出了和真人一模一样的机器人呢,郑渊洁也写过。

灵魂要不然接入什么聊天机器人?

—— 来自 HUAWEI VTR-AL00, Android 8.0.0上的 v2.0.3

真不能指望我有什么华丽丽的过程,这个制作过程肯定是“姿态很难看”,内容很枯燥

没错,接入聊天机器人是一个选项



全息投影仪收到了,研究后正在思考下一步的动作。
图中手机,iPhone 5c
应该需要设计神经网络交互逻辑吧
完全不懂编程的我乱说的,如果错了请不要在意

—— 来自 OnePlus ONEPLUS A5000, Android 8.1.0上的 v2.0.3
看标题以为PO至少已经实现了这个想法,做了个 demo 什么的
点进来一看……这是从采购材料开始搞啊
不是很看好
从零开始还行,未来的泥潭强者
大学时做过一个玩,不过效果不太好。马克一下等看lz成果

取决于最后到底想要达到何等效果,我是这么想的。

不过前提是“神经网络交互逻辑”的定义是什么。

重点应该是实时演算3D模型输出画面
这些全息投影就是骗人用的,没必要浪费时间

我的各方面水平都很低,我对于最终结果的要求,至少第一代迭代成品的要求非常低,

而且失败是学习的一部分,要是卡在哪一步就是不能前进了,我会认为是自己某个“先决条件”的课程没学所以做不到,那就先学那一部分的知识,然后再回来继续,像这样解决问题。




能说说吗,你可以看见我的水平低于海平面了,不管你做的是什么都比我好,所以可以说出来尽情嘲笑我的。

比如你做过的,需要哪些硬件,编哪些软件,具体能实现哪些功能。

有图更好,有视频更好

对话功能的实现需要神经网络的逻辑吧

—— 来自 OnePlus ONEPLUS A5000, Android 8.1.0上的 v2.0.3
楼主的语音功能准备怎么实现?用科大讯飞的api吗?
楼主需要人设吗

你们诸位先等等,就能看到我对于成品的要求低到海平面以下去了。

你们诸位先等等,就能看到我对于成品的要求低到海平面以下去了。

需要;

您先等等我发出下一个贴来,看看我需要做的那3D建模啥啥的您会做不,我会尽量写得很清楚我到底要干嘛,我的困惑和困难是什么,我以后打算咋样,说不清的地方拍视频说给大家看。
突然觉得你这个完全可以参照一撸神的Hgame
精神上支持一下楼主

专门去查了你在说啥,他们涉及的唯一硬件就是某个可以有体感的马甲?那对我小白来说真是太难实现。

他们的3D建模可以参考参考。
mikumikudance社区可以直接下模型,照着拖就能编舞
精神上鼓励
lz不是自称妹子吗,人设崩了?

谢谢,也许会对我很有用
我早就做好了虚拟女友102这一步也写好了,我已经在做下一步的工作了;没发出来是因为我这次用视频辅助

说明我的过程,这个视频发到bilibili楞是通不过审核,我觉得审了有大于24小时吧,才通过的

,我也没什么了不起的内容在视频里呀,这么普通的视频需要审这么久才通过吗?我以前也发过

视频到bilibili,从来不用审这么久,这次不明白是为什么。我同时也传到youtube了,那个不用

审一下子就发布了。
伪全息投影也是全息投影:虚拟女友计划102

其实我选的这种全息投影设备真的很简陋,也不是没有更高端的,但我买不起。现在我可以买或自制的这种金字塔全息投影设备可以投影四个面,前、后、左、右,要知道,GATEBOX其实只有一个平面的投影,这种金字塔式的设备虽然极其简陋,其实在这种问题上却比GATEBOX强。

说白了这种还是伪全息投影,只是利用了光线折射(?)而已,要实现伪全息投影,我有两种选项:
1.上网找别人做好的全息投影视频,非常多,质量参差不齐
2.自己做全息投影视频,需要思考的东西无限增加,但是为了“灵魂”那一步,这有可能是不可或缺的。

作为现在首先踏出第一步的选择,我先选第一种,“有什么播什么”。要播放很简单,用手机播放,然后把手机放在全息投影设备的上面/下面(取决于视频本身和投影设备本身)。

但是,即使是使用网上现有的视频资源,也不是随便一个就有好的效果。

如以下我做的视频中所说的那样,简单比较两个视频,就可以看出效果的好坏(对我个人而言),前者前、后、左、右四个面的影像是一样的,但是后者却做出了人物的正面,左侧,右侧,背面。因此,后者需要的工作量也就有前者的四倍?如果我自己制作全息视频,我可能要先以简陋的这种视频为第一步目标。
http://youtu.be/_NpVRqh_vSY
http://www.bilibili.com/video/av32447300/


效果较好的视频一般搜索关键词是“MMD hologram”,我看要是去niconico找这种视频肯定会更多,但是不懂日文就不去了,我都是直接在油管找。

其次,我对投影设备的大小非常不满意,比如说GATEBOX的硬件就是大概咖啡机那么大的,同时,解决这个问题的直接方法也很简单,买/自制更大的投影设备,再加IPAD/类似大小屏幕的设备。但是如果要改变硬件大小,需要的成本就成倍增加,所以作为DIY,市面上有什么解决方案就先用最简便的。不过如果我后面几步真能解决问题,我还是想要一个大点的投影,“弄个大点的”比起我面临的其他困难来说实在只能算小困难。

最后,目前这一步只是能展示投影而已,这还说不上是最简单的机器人


残念了,只会做2d设计
。。。怎么这么多理想的人,,实际全部做完顶天就是最后变成个能放动画的全息投影仪,全息投影现在都不是技术难题,所谓的灵魂才是真正的难题,与其自己做不然好好赚钱,等出了好的深度学习的人鸡交互系统,到时候直接买个老婆
{:1465_1695:}国产不是也有这种的消费级产品,什么琥珀什么的,题主的目标基本就是diy一个消费级产品水平的东西出来吧,,,

我的目的不是要“买个老婆”,是过程,是要玩DIY和学习制作的过程。

没关系,谢谢有心支持

是我没写清楚,我没想要做到消费级产品的水平......
傻瓜想做的语音交互到底怎么才能做出来:虚拟女友计划103

首先,各位ACM比赛大佬,机器人比赛大佬,各种编程大佬,硬件大佬,如果有人看我写的这种小白思路,希望你们不会被我气死或啰啰嗦嗦磨叽死。

我的设计思路如下:

我的最终计划也不包括做智能家电。完全没有。

我到底要实现什么?“我对她说HELLO,她要能对我说HELLO。”我首先定下就这一个功能,我就实现这一个东西。

本质上是,用声音触发她的状态A,没声音触发的时候她的状态就是B。

我一个小白理解这就是状态机(对,我不知道我在说什么)。

待机状态:状态B, 比如说就是一直播放跳舞的视频。没人触发,就一直跳舞。

触发状态:状态A,播放“hello”的声音。这时人物的3D模型怎么办,我首先想一个偷懒的办法,用一个水晶球之类的简陋的全息投影视频代替,也就是说我一跟她说话,她的全息投影就从跳舞的妹子变成抽象的水晶球,并播放“hello”的声音。播放完后,(可能应该停顿3秒?)回到跳舞状态。


怎么触发,用我说“hello”的声音触发,那这里涉及各种想法:

一定要“hello”吗,别的语句可不可以?
一定要我说吗,别人说可不可以?
一定要人声吗,其他不是人声的声音可不可以?
一定要声音吗,按按钮可不可以?
等等。

在我实际做的过程中,可能我做一个APP/软件的话,

首先我做一个按按钮来触发状态的小软件,如果顺利,再做声控触发(任何声音),如果顺利,再做人声触发(?),等等,看情况而定(也就是看我这么蠢会不会在哪一步做不下去了)。

另外声音方面现成的解决方案就是比如接入google assistant?具体说来,可能我不需要整个google assistant?如果用Unity, 可能要研究API.AI"s Unity SDK。也有可能要研究其他,像是Google Cloud Speech API。(一概不懂是什么,名词都是网上搜来的。)

硬件方面就是要有麦克风,扬声器,作为声音的输入和输出。

对,这也会导致我考虑一个偷懒的方案和一个困难的方案。

想是这么想,在接下来学习的过程中,发现我想偷懒也偷不了懒,当然困难的方案还是很困难。

只要求简单的语义识别和条件判断吗

复杂一些的您能举例说明吗,比如说能做什么/识别什么/判断什么?
硬件手机不行吗,写个app监听麦克风,把声音socket发给你的电脑,去git上下个简单的rnn之类的神经网络处理wav格式的音频信息。如果只要是hello的话可以不要神经网络,测一下自己说hello的频率,声音滤波的结果差不多就触发
mark一下
老实说我也想做

偷懒的方案:Google aiy kit
中文的语义识别不怎么靠谱,即便是科大讯飞。不知道英文的怎么样。

我在实际操作中碰壁了很久,最后想要定的方向和这个的确有重合
幻想有简单的方案其实只是因为自己没亲手做过:虚拟女友计划104

(幻想的)偷懒的方案:
本来全息投影就是靠手机播视频,那直接做手机APP,继续利用手机本来就有的硬件(麦克风和话筒),就不用再考虑格外的硬件了。

这个方案并不是没有问题,第一,这样解决问题,就相当于虚拟女友更没有实体感。除了全息投影,其他都在手机里,更没有“机器人”的感觉。

第二,我只有iPhone,如果我选google assistant做语音识别的解决方案,不知道iPhone apps+google assistant在iPhone上用会是什么体验...要是不行,我是不是还得买个Android系统的设备......我希望能少买硬件,控制成本,这种愿望不知能否实现。

刚刚看了一下,siri也开放给开发者了,我可以考虑这两种都试试......这第二个问题大概不算太大问题?

第三,不知道大家能不能理解,当我把手机架在全息投影仪上播视频的时候,我对手机进行按键、输入的操作会不太方便,所以最好还是能做成95%声控的(可能还是要按home键什么的)。如果我做不出声控的小软件,那我就卡死在这一步了。

说是偷懒的方案,其实也偷不了多少懒。

困难的方案:
硬件采用另外的处理器,麦克风,扬声器,那就是比如说我买个树莓派,ARDUINO之类,再买配套的麦克风,扬声器,再自制语音软件/接入google assistant之类的解决方案,(这里应该不能用siri?)

噢,还忘了,这要是不用手机播视频我还得另外给树莓派接投影仪类的设备以播放全息投影视频?也可以把树莓派和iPhone连接起来,把iphone当显示器用......(如果真能顺利做到的话。对此我十分怀疑。)

这种方案下来倒是更有实体感了,就是除了手机以外还有一大坨硬件,做出来不会太美观。可能我自己做个DIY的东西给自己也不需要考虑什么美观问题吧。
(对,对我来说就是很难。)


鼓励下楼主!
就工程方面,建议先从最懒惰的方法开始,比如用google assistant + 安卓手机之类的,先做一个立等可取的demo,然后慢慢加功能迭代。
这样比较容易上手,挫败感不会特别强
楼主这个行文方式和逻辑有一点阿斯伯格症候群的迹象,不过这是好事,更容易持之以恒坚持在一个项目上取得较大的成就。

—— 来自 Xiaomi MI 5, Android 8.0.0上的 v2.0.3-play
这个...你开心就好...
我觉得吧 不需要什么人机互动  能脱衣服跳舞就能热卖了
放弃了?

—— 来自 Xiaomi MI 6, Android 8.0.0上的 v2.1.2
死宅造老婆,三年不成

—— 来自 HMD Global Nokia X7, Android 9上的 v2.1.2

是看了我其他的贴把这个贴翻出来了?我找了新工作太忙了......可能有一天失业的时候就有空学习了

您说的是,我接受