如何收集数据以绘制房价图

我们带来这篇文章是为了分享高质量数据可以为您做些什么。这一次,我们向您展示西班牙毕尔巴鄂的房地产示例数据集。

内容是从一个知名的房地产网站收集的,并毫不费力地插入此处。原始数据集包含一些与演示无关的字段,因此为了简单起见,我们删除了它们。无论如何,地图将忽略附加字段。所以你可以使用你的数据集并让它为你工作。您可以在这个GitHub 存储库中找到工作示例以及使用它所需的一切。

地图代表什么

我们从毕尔巴鄂拿了 3000 套待售房屋,并通过地理定位将它们绘制在这张地图上。在不添加更多信息的情况下,这只是地理表示。我们可以用地图标记来显示出售房屋的位置。

但我们决定通过添加与定价相关的数据来增加一些额外的权重。查看几个表示和房地产信息,我们选择按单位面积价格(在本例中为平方米)的热图。这意味着每个列表都将是地图上的一个点。因此,每平方米的价格越高,它就会越红。

热图意义

该地图工具可让您关注每平方米价格最高的区域。考虑到这是一个近似值,所以不要盲目相信结果。将其视为一种表示,因此可能无法代表整个图片。

热图只是众多图表类型中的一种。因此,首先分析您的用例和可用信息然后考虑最好地表示它是很方便的。

我们如何获得数据

核心部分是数据;地图只是一种以图形方式表达该信息所代表内容的方式。它可以帮助专家指出正确的方向或在某些领域进行进一步调查。但高质量的数据是采取事实支持的行动所必需的。

在我们的例子中,数据直接来自一个知名的房地产网站,我们使用ZenRows Tasks获得了它。我们确定了来源,得到了这个演示的想法,然后轻松地创建了一个任务来提取所有信息。它在不到一分钟的时间内收集了近 3.000 个数据点。

这里有两个数据片段:第一个直接来自任务,第二个由我们手动处理以减小其大小。出于同样的原因,原始的不完整;我们将在演示存储库中发布一个示例数据集。

{
 "price": 475000,
 "formattedPrice": "475.000 €",
 "dateTimestamp": 1622565227557,
 "latitude": 43.25794,
 "longitude": -2.925409,
 "country": "España",
 "neighborhood": "Casco Viejo",
 "city": "Bilbao",
 "bathrooms": 2,
 "rooms": 5,
 "surface": 189,
 ...
}
{
 "latitude": 43.25794,
 "longitude": -2.925409,
 "pricePerArea": 2513
}

ZenRows 任务

这个过程很简单。
为任务选择一个名称,填写一组 URL,然后点击运行。这就是你所需要的。好吧,要验证的想法或假设会有所帮助,但这取决于您;)

我们提供了一个简单的过程来获取数据集,可以是一次性的,也可以是重复的。在这种情况下,我们设置了一个一次性任务来收集几千个 URL,因为随着时间的推移似乎没有必要获取数据。但是,例如,如果我们想要分析价格如何演变,则重复任务将是理想的选择。

如何轻松获取所需数据

最具挑战性的部分之一是获取数据,然后通过某种自动化以结构化方式转换数据。然后提取见解。所以这个过程毕竟不容易。好消息是,我们可以在这方面为您提供帮助。

我们鼓励您事先进行一些研究,以确定满足您需求的可信赖数据源。只有这样才能启动自动化过程。

这有什么用例

    • 其他一些房地产案例

以房地产为例,我们可以更改数据以突出显示最大的房屋或最昂贵的房屋。对于机构或投资者而言,绘制一些数据并寻找异常值或机会可以帮助提取一些好的见解。

    • 人口密度

最近,关于内部迁移以及人口密度是否会因远程工作而发生变化的讨论很多。这是热图的一个很好的用例,主要是如果您使用带有州形状或您所在地区等效物的地图。这是按国家/地区划分的人口密度(每公里人口2
的示例,来自维基百科

    • 平均工资

这里没有太多要补充的,这是一个永远持续的讨论,我们不会就此平息。但我们至少可以说明一些问题。与前一点一样,带有形状的地图有助于彻底理解数据。在这种情况下,市政当局甚至比各州做得更好。

    • 共同航班始发地和目的地

我们都知道我们地区的大型知名机场,但也许有许多我们忽略的异常值。我们可以在热图或流程图中绘制所有这些信息。如果您出于某种原因计划开设一个新机场,您可以在地图上包括人口密度以找到最佳匹配。我会说,这不是一个典型的案例。

    • 商店和潜在市场

也许这是前面示例的更好用例。想想任何正在寻找新地方的连锁店。您可以为现有标记和人口热图设置标记。或者更好的是,增加你的客户类型的权重——例如中年女性。

    • 抗旱

通过直接应用于农业,及早发现干旱至关重要。我们不是气象学家,但我们可以将温度和降雨数据点转化为地图,然后帮助专家解读原始数据。

    • 餐厅密度或定价

通过用餐厅价格替换每平方米的价格,我们可以毫不费力地画出非常相似的东西。您可以使用我们为此演示创建的小型存储库进行试用,并从 Yelp 或 Tripadvisor 获取数据。

结论

地理热图只是表示数据的多种方式之一。我们需要一个准确的信息源、一种从那里提取结构化数据的自动化方法,以及一个揭示洞察力的过程。

我们的无忧流程将帮助您快速获得所需的数据。因此,请查看我们的内容以获取数据源和表示形式的灵感。

类似文章