百科问答小站 logo
百科问答小站 font logo



为什么很少拿神经网络来直接做滤波器呢? 第1页

  

user avatar   zhangshujia 网友的相关建议: 
      

举个例子: 记得《Nature》有篇研报是“图像处理速度提升2万倍,传感器用作神经网络载体”。

这算是拿raw的data graph在传感器层面直接算的意思咯(analog有一个运算思路就是模拟滤波电路), 应该是取代视觉cnn asic的合理路径,其它nn不适用吧…。算法前置(印刷)到传感单元,路线可行但工艺决定经济价值,还得取决于通用性,或者说是印刷(可编程的)成本。而向SdC方向推进的难度在制造(硬迭代)成本,几年后eASIC可能是路径,但若要改变光电突触的响应来调节权重,就需要可再编程的方案吧…,或理解一帧就是一个graph,也可以说成是,就是那些光电突触在一个单位时隙的算力。

应该也不用担心面积问题,CMOS缩放差,大概28nm也用不上,记得光栅都是50nm+,光电转换单元是受光学(衍射)干扰的,所以电路不能缩小,几百也正常。

猜测短期有工艺问题,光电转换电路跟logic电路混在一起,材料有差别的,找到两者都兼容的材料工艺可不容易;这篇文中提到了一个二硒化钨涂层,意味着产线也要改阿:)


user avatar   zhen-tan-83 网友的相关建议: 
      
  1. 为什么很少看到拿神经网络作为低通或高通滤波器对传感器的时序信号滤波?

其实,天下算法一家亲。从另一个角度看,不管是IIR还是FIR滤波器都可以看成神经网络

君不见,FIR可以等价成没有隐藏层,只有输入层和单个节点输出层的神经网络吗?IIR则是从输出加了一个反馈到输入层。而它们都是0偏置,没有激励函数(或者说激励函数为y=x)。

不同点恐怕只有训练方式了,FIR/IIR是根据前人的理论推理“训练”出来,具有可解释性,而这不正是神经网络的不足之处吗?既然FIR/IIR已经存在一套成熟的理论去分析和解释,何必冒风险和推高计算量用神经网络呢?神经网络这种通用算法,恐怕更适合去做现存的各种疑难杂症以及无法用理论推理的难题。


2. 至于“有些信号含色噪声和其他乱七八糟的噪声,挺难滤掉的呀”

这种就是属于疑难杂症了,的确可以考虑用神经网络。但是你既然都搬出神经网络大法了,干嘛只用于滤波?针对你的目的,你其实可以直接用神经网络一步到位。比如你要通过ECG信号,识别病人是否患有什么心血管病,那你就直接用个两分类的神经网络,1表示患病,0表示健康。然后将所有样本喂进去训练和测试即可啦。

但实际应用中,考虑到计算量,你可能做不到一步到位。想想当信号采样率为1000时,你的算法却在芯片执行,再考虑芯片那珍贵的内存和计算量,用神经网络从原始数据提取信息简直不现实!这种情况下,你可能需要先用传统滤波尽量滤掉噪音部分,然后从信号中提取出简单的特征,将这些特征作为输入去训练神经网络,这样计算量将大大降低。当然,你也可以尝试降采样再喂信号进神经网络一步到位,具体得看实际应用啦。


user avatar   long-yun-2 网友的相关建议: 
      

很多时候是应用场景的限制。

更直白点说,功耗

如果没有功耗的限制,神级网络都能做。

举个例子。华为的基站芯片,天罡。一个ASIC芯片,里面所有算法全部是定制化的。

针对实际物理信道和射频器件的损伤,全部做的针对性补偿和定制化的算法。

归根结底,里面都是些FIR、FFT。

其中大部分算法甚至是解析公式推出来的最优解。

就这样,功耗都打不住。

如果用神经网络来做。功耗得多大?

这种解析公式很多都能写出来的系统,用神经网络训练出来也是逼近那个解析公式。我都知道公式了,为什么要用神经网络

另外,个人认为神经网络还是更适应于那些慢变或者不变的系统。比如人脸识别,训练好了拿出来用。而对那些快变的系统,神经网络是不太合适的。

举个例子,一个简单的自适应滤波器。用神经网络来实现,肯定是得不偿失的。


user avatar   huo-hua-de-41 网友的相关建议: 
      

基于神经网络的滤波就是mask prediction。已经比传统的滤波器强大太多。

在语音领域,可以预测一个噪音的mask,直接把噪音给滤掉。一堆人说话,可以预测说话人的mask,单独把说话人的声音提取出来。

在图像领域,可以去雾去霾去雨,去阴影,甚至还可以把水里拍的照片变成陆上拍的样子。

这已经比只能在频域上利用器件的线性或者非线性组成一二阶系统,搞点事情的低通到高通带通滤波器强大太多。




  

相关话题

  什么是大模型?超大模型?Foundation Model? 
  人工「神经网络」技术在信息处理上有何特点,工作原理是什么? 
  对神经网络某一层做了小改进,效果却提升显著,可以发论文吗? 
  如何理解“函数卷积的傅里叶变换等于傅里叶变换的乘积”所代表的实际意义? 
  Hardware Emulation Platform (硬件仿真平台) 在IC验证中的运用情况如何? 
  深度学习中Attention与全连接层的区别何在? 
  Batch Normalization 训练的时候为什么不使用 moving statistics? 
  要研究深度学习的可解释性(Interpretability),应从哪几个方面着手? 
  神经网络中 warmup 策略为什么有效;有什么理论解释么? 
  如何看待中兴被美国制裁的事件?中兴该如何应对事件? 

前一个讨论
如何看待半导体公司Cerebras制作出面积最大的运算芯片?
下一个讨论
如何通俗解释流动性陷阱?它与量化宽松有何关系?





© 2024-05-19 - tinynew.org. All Rights Reserved.
© 2024-05-19 - tinynew.org. 保留所有权利