广州小汽车增量系统

广州小汽车增量系统

要买车,但是要车牌呀,大城市都要摇号,这是个问题。

所以,第一步,我们就先看看有什么公开信息。首先到底是怎么竞价的?

也就是说,有1次报价和2次修改报价的机会。而系统也说会在竞价系统在竞价日当天上午11:00时和下午13:00时分别公布当前平均价格(在当前报价中,将竞买人按照’价格优先’的原则由高到低依次排序,剔除排名靠前10%和排名靠后10%的竞买人人数及其对应有效报价后,以剩余80%竞买人人数及其对应有效报价总额计算出平均价格,计算数据按四舍五入取整)。还好博士有优惠可以免平均的竞价的钱,但是到底多少钱能竞价到牌照呢?

第二步,在官方网站上我们看到了一组信息:

链接是这个地方:http://www.gzqcjj.com/article/gonggao/202002/20200200000884.shtml

当然我们更关心的是个人的情况表:

可惜的是网站上没有放Excel文件,只有图片,所以我们首先使用了OCR网站(网上随便找的:https://zhcn.109876543210.com/),然后把图片转成Excel图。

虽然会有一些识别错误,但大多数数据都是对的。所以我们可以看到有两次播报,也就是上午11点和下午13点的平均价,还有最终的交易平均价和最低价,但是我们可以看到这个数据波动很大,从1w到5w都有可能。那怎么整呢?

首先我们想到的是看增量,而不是看绝对值,因为增量更有信息量:

所以我们就用最终的最低价和平均价和第二次播报(也是最后一次播报)的平均价做了减法,好消息是,当我们做了平均值之后,可以看到最低价和第二次的价格差在4000左右,而平均价和第二次价格差9500左右。但是同时我们也有一个坏消息,那就是增量的变异非常大,如果我们用最低价和第二次相差的4000块甚至再加上1000,也就是5000块,我们在过去两年也就是24个月中,有13次是竞价不到车牌的。而如果我们使用价格差的平均数,也就是9500元,那么我们多花冤枉钱的概率也非常大。那怎么整呢?

这个时候,路提出了一个“冒险系数”的假设,也就是说我们要看同一批竞价的人的冒险性是怎么样的,也就是第一次和第二次报价的平均值的差,然后我们就将做出了以下的值。然后我们将差值和平均值和第二次的比值做了一个相关

也就是这样的相关,Excel给了我们一个惊奇的答案,correlation值在0.4左右,p值也小于0.05,是一个显著的,所以基本上证明了“冒险系数”的假设是成立的,也就是说如果这一群人第二次报价和第一次报价的差异越大,那么最终的平均价格也会更大。

之前的计算中还是有一个问题,那就是第二次和第一次的报价没有做标准化,这个时候我们就做了标准化,也就是用第二次除以第一次和平均除以第二次做了相关,皮尔逊correlation居然到了0.5左右,p值也到了0.01,说明更显著了,方法更对了。

但是这个还是没有能最终解决问题,那我们该用多少钱竞价,才能比较稳妥呢?也就是和平均价格相近呢?这个时候我们就拿出了MATLAB,打开了cftool,用最简单的一阶polynomial的,我们将我们得到的值输进去,得到了这样的结果:

其中b就是最终平均价除以第二次报价,而c就是第二次报价除以第一次报价。这个时候我们就将b和c分别assign到y data和x
data上,我们就能得到最后的线性模型

Y = 3.497*x – 2.318

我们之后就用这个来报价格吧,看看准不准吧。

Updated. 2020.5.5 最后模型预测的平均价格是17600元,而真实的平均价格是17086元,相差514元,可以接受,模型基本成立