Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 10|回復: 0

另一个挑战是树属的长尾细粒度

[複製鏈接]

1

主題

1

帖子

5

積分

新手上路

Rank: 1

積分
5
發表於 2024-5-9 19:04:59 | 顯示全部樓層 |閱讀模式

性质即使对于人类专家来说也很难消除歧义因为许多属相当罕见。类别的长尾分布。大多数示例来自几个常见类别而许多类别的示例要少得多。我们根据训练样本的数量将每个属描述为频繁常见或罕见。请注意测试数据在每个城市内与训练数据在空间上分开因此并非所有稀有属都出现在测试集中。最后树木图像可能通过多种方式产生噪声。其一落叶树存在时间变化例如航空图像包含树叶但街道图像是裸露的。此外公共树木普查并不总是最新的。因此有时树木在进行树木普查后就已经死亡并且不再可见。此外航空数据质量可能很差丢失或被云遮挡等。我们的管理过程试图通过以下方式最小化这些问题仅保留具有足够树木像素的图像由语义分割模型确定仅保留相当近期的图像以及仅保留树木位置足够的图像靠近街道摄像机。

我们还考虑了对春季和夏季看到的树木进行优化但认为季节变化可能是一个有用的线索因此我们还发布了每张图像的日期以使社区能够探索季节变化的影响。基准与评估为了评估数据集我  格鲁吉亚电话号码列表 们设计了一个基准来衡量分布长尾的领域泛化和性能。我们在三个级别上生成了训练和测试分组。首先我们对每个城市进行划分根据纬度或经度看看一个城市对其自身的概括程度如何。其次我们将城市级培训集分为西部中部和东部三个区域每个区域提供一个城市。最后我们合并三个区域的训练集。对于每个分割我们报告了相应测试集上频繁常见和稀有物种的准确性和类平均召回率。使用这些指标我们使用标准现代卷积模型建立性能基线。




我们的结果证明了大规模地理空间分布式数据集例如的优势。首先我们看到更多的训练数据会有所帮助——对整个数据集的训练比对一个区域的训练要好而对一个区域的训练又比对单个城市的训练要好。每个城市在其自身区域和完整训练集上进行训练时在测试集上的表现。其次对类似城市进行培训会有所帮助因此对城市进行更多覆盖会有所帮助。例如如果关注西雅图那么在温哥华的树上训练比在匹兹堡训练更好。跨集性能查看每个城市的训练集和测试集的成对组合。请注意块对角线结构它突出显示了数据集中的区域结构。第三更多的数据模式和观点有帮助。性能最佳的模型结合了来自多个街景角度和俯视图的输入。


回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|自動贊助|GameHost抗攻擊論壇

GMT+8, 2025-4-19 23:26 , Processed in 0.036342 second(s), 18 queries .

抗攻擊 by GameHost X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回復 返回頂部 返回列表
一粒米 | 中興米 | 論壇美工 | 設計 抗ddos | 天堂私服 | ddos | ddos | 防ddos | 防禦ddos | 防ddos主機 | 天堂美工 | 設計 防ddos主機 | 抗ddos主機 | 抗ddos | 抗ddos主機 | 抗攻擊論壇 | 天堂自動贊助 | 免費論壇 | 天堂私服 | 天堂123 | 台南清潔 | 天堂 | 天堂私服 | 免費論壇申請 | 抗ddos | 虛擬主機 | 實體主機 | vps | 網域註冊 | 抗攻擊遊戲主機 | ddos |