400
# 2022.06.20
# 今日任务
准备华为杯人工智能创新大赛
- [ ] 简介(300字,学弟完成)
- [ ] 视频录制(PPT项目讲解及演示)
- [x] 中文论文(由我完成)
- [x] 项目文档(整体完成,由潘锵和学弟完成)
GA (使用Mind the Graph)
Response
Review1
- [x] 由于数据集对基于dl的方法非常重要,作者应该指定使用的数据集的细节,如补丁大小和模拟过程(噪声水平等)。 另外,还缺少一些网络细节,比如内核大小和通道号。 请尽力提供进一步的信息。(训练集,测试集的图片尺寸及增强方法都说了,训练的噪声是Non i.i.d.+混合噪声。网络细节上,整体架构浅层特征层和重构层都已经说明了输出通道数和核大小。在SSA模块中前两个卷积已经说明了是1x1x1卷积,SA中用的是两个并行的3x3x3卷积)
- [x] 据我所知,3d -卷积可能需要更多的网络参数; 因此,请提供一个网络参数的比较。 (144,815,847)QRNN3D(860,000)
- [ ] 在图15中,它给出了一些4和9波段的特征图。 这是什么意思? (做完注意力后得到SxBxCxHxW维度的矩阵,我们根据注意力的权值选择了两个波段中值最大的前16个)
- [x] Please improve the language, e.g., “lack” should be “lacks” in line 129; “multiplied” should be “multiply by” in line 184; “in the 3D GAP which makes…” should be “the 3D GAP makes…”.
- [x] 将图8替换为高质量的图像效果更好。 (提高分辨率)
Review2
- [x] Line 2 and Line 24: “Deadline noise” is not common knowledge and is not described in the reference. (添加了一篇2021的去噪论文综述,里面有噪声图)
- [x] 281行:输入码为64x64x31。 但是并没有清楚地描述验证集的预处理是如何获得序列集的相同维数的.(测试集用的是中心区域裁剪)
- [ ] 图2:我建议对架构有更好的描述。 其中一个例子是论文《SSCA-Net:用于多尺度结构保持血管分割的同时自我和通道注意神经网络》 (这是在暗示引用这篇文章嘛)
Review3 (其他老师弄)
- [ ] 英语母语的校对者可以检查英语语言
- [ ] 作者可以强调创新的要素和广大公众的具体利益
- [ ] 作者应该展示论文的计算方法(在整个工作中使用的语言)。
Review4
- [ ] 在引言中,作者指出,“然而,用这种方法去噪会导致光谱信息的损失,因为光谱波段之间的相关性被忽略了。” 在动机部分也有类似的陈述,“首先,现有的方法在空间和光谱相关性方面是不确定的。 由于理解不足,HSI去噪的性能受到很大的限制。”为了更好地激励他们的工作,作者应该更直接地陈述这种损失的重要性,以及为什么它会受到很大的限制。 (在Introduction和Motivation中有重复描述。空间域没提取好,不好准确的去噪声,可能会错误的将背景信息去除,或者局部的噪声去的不完全。)
- [ ] 从介绍中不清楚为什么“跨空间非局部自相似性(NSS),沿谱全局相关(GCS),低秩张量,稀疏编码等”是合理的假设或先验知识。 这些假设什么时候成立,什么时候不成立? (好专业呀,我也不懂,难)
- [ ] 动机中“其次,以往的方法对HSI波段的多样性适应性不足,一些特殊波段的噪声无法去除”的表述是非常模糊的。 更具体地说明之前工作的实际问题及其影响。
- [ ] “这导致不可控的参数数量和不干净的去噪,甚至可能失去图像细节”的声明是模糊的,需要明确。
- [ ] 最终,从动机来看,所建议的解决方案是如何解决这些问题的,以及所建议的方法在哪些应用程序中是有保证的,最终是不清楚的。 此外,了解当前工作与这些先前工作之间的权衡将是有深刻见解的。 作者是否认为所提议的方法在各个方面或在特定的用例/应用中比现有技术更好?
- [ ] 从文中不清楚的是,在提议的方法部分中提出的最终解决方案是如何推导的。 当然,作者进行了一些分析、模拟等,以确定网络架构、超参数、内核/层大小等。 更好地理解导致最终解决方案的过程是重要的。 作者在解释解决方案的高级部分方面做得更好,比如为什么要使用U-Net。
- [ ] 目前还不太清楚为什么注意力机制对所提出的解决方案有用。 作者指出,“注意机制的不当使用会导致信息模糊或扭曲”,“目前提出的许多注意机制不能直接应用于人机交互去噪”。 然而,除了“为了更好地提取HSIs的NSS和GCS知识”这一模糊的表述外,为什么关注这个问题并不清楚。 这个说法背后的直觉是什么?
- [ ] 审稿人不清楚第3.4节的目的和影响,该节中的图(图6除外)非常密集,难以解释。 As shown in的用法很多,但作者应该更具体地说明我们如何从视觉上看到他们想让我们看到的东西。 (图片的点太密集)
- [ ] 作者指出,图11的最后一列是基本事实,但根据标签,最后一列是建议的解决方案输出。 (少了GT图,简单)
- [ ] 应该更具体地说明每个图像中的红框(如图11)代表什么,以及应该带走什么。 对于预期的应用程序空间,所看到的更改中什么是重要的。(5种Case的比较做更具体的说明)(简单)
编辑 (opens new window)