數據分析狂想“親~我的東西什麽時候到”

背景:

當你在某寶上,網購了一件商品後,一定會得空看看,你的貨發了沒,到哪裏了。但是何時能到,你不知道。你最多也能憑經驗,或者憑別人的經驗,對別人的經驗。別人可能是你的同事你的室友,或者其他人,同時此人有從同一發貨地買過東西的經曆,或者更巧合的是她上星期剛從同一家買過,這個可信度就更高一點,但也有可能完全不對,這主要是不可改變的因素,我們稍後再說。好我們開始今天的主題——如何推測網購貨物到貨日期。

基本思想:

就是通過貨物快遞日志數據抽取,取平均值,並考慮各種其他因素組成的各種不同的模型。科學地的將別人的經驗,變爲自己的基本正確的預測信息。

晴天模型:

{在晴天天氣條件下+某快遞公司+(從目的地出發時間—到收貨地時間[是否可根據不同快遞員進行細化])}近3個月數據求平均值=到貨時間

惡劣天氣模型:

{在惡劣天氣條件下[可根據不同天氣細化]+某快遞公司+(從目的地出發時間—到收貨地時間)}近3個月數據求平均值=到貨時間

大型人類活動模型:

{在[根據XX運動會/XX政治會不同的活動細化]條件下+某快遞公司+(從目的地出發時間—到收貨地時間)}近3個月數據求平均值=到貨時間

節假日模型:

{在[根據近3年五一/十一/春節進數據進行劃分細化]條件下+某快遞公司+(從目的地出發時間—到收貨地時間)}近3個月數據求平均值=到貨時間

注釋:

在XX條件下,根據天氣、節假日、會議,對提取的日志數據進行劃分;

在某快遞公司條件下,因爲不同公司運送時間是不同的,這是衆所周知;

節假日選取近三年數據是考慮第一個條件交通工具和道路建設的因素;

從目的地出發時間—到收貨地時間,選取近三個月數據,是考慮最近的可能准確一點(個人己見)。

准確度優化:

用微分思想,化整爲零,將正個路程,分成很多段,每段都按照上述模型進行分析,最後將每段的預測時間相加,就是總的預測時間。而且這樣更加科學准確。

 

 

歡迎各位補充,指正,爲美好的明天而努力。

 

更多相關文章
  • 活動背景由于數據分析與雲計算正在發展過程中,各方面的人才與知識的資源都不是很充分,因而發起此活動.征集大家在工作中遇到的實際問題,通過聯系我們匿名發布在各平台以案例討論的形式,呈現給論壇技術網友,大家一起群策群力,一方面提案者可以從大家的參與中得到解決問題的啓發,另一方面參與的會員也可以從中收獲問題 ...
  • 網站運營 小議SEO數據分析III – 維護詞庫
    前言具體上一篇SEO數據分析文章已經隔了很久了,今天有個朋友網上問我,有了詞庫怎麽維護.正好借這個機會談談這個問題. 在獲取到大量關鍵詞後,首先要對這些詞進行處理,在我實際工作中,總結以下幾個專案我做過或者覺得有必要做的事情. 提取實體(通俗點講就是找關鍵詞中的重點詞) 去重 受控詞表 分類 提取實 ...
  • 目前有些人關心行爲數據,也有些人關心商業數據,但較少人把行爲數據和商業數據聯系起來看.大家往往只單純看某一端數據.但是看數據走火入魔的人 會明白,每個數據,就像散布在黑夜裏的星星,它們彼此之間布滿了關系網,只要輕輕按一下其中一個數據,就會驅動另外一些數據的變化.前一段日子見到一位數據發燒友,我們倆有 ...
  • 時間序列數據分析
    時間序列是一個十分常見的數據類型.幾乎所有商業上的數據集,都有一個時間的dimension.而很多商業的數據分析,也是集中在數據隨著時間的流動的變化規律.我們這裏通過對北京的房價數據做一個時間序列分析,從而探討一下不同可視化方式的有效性.下面是北京房屋均價在2009和2010的數據集(部分顯示).對 ...
  • [百度社招]網頁搜索部數據分析工程師 工作職責: 負責用戶行爲數據的分析,挖掘,從海量的數據中找出有用的信息 -負責研究算法,利用用戶行爲模型對産品進行評估和改進 -負責構建用戶數據模型,研究互聯網産品,用戶變化,用以支持各項決策 -負責因專案研發需要而賦予的其他工作職責     任職資格:     ...
  • 大數據分析:點“數”成金----第三章:大數據與商業案例
     第3章   大數據與商業案例 時髦概念到實際應用,大數據只用了很短的時間就完成了這個華麗的轉身.曾經,不計其數的組織機構砸下重金研發大數據的周邊技術.但現在,他們已將重心轉移到發掘大數據真正的價值上來. 即便如此,就像當初那些顛覆性技術給不少IT(信息技術)管理人員帶來的困惑,如今依然有許多人對大 ...
  • 大數據分析:點“數”成金----第一章:什麽是大數據
         第1章   什麽是大數據   "大數據"到底是什麽?這個概念乍看上去相當模糊,它似乎指的是數量龐大信息量巨大的數據.盡管這樣的描述確實符合"大數據"的字面含義,但它並沒有解釋清楚大數據到底是什麽. 大數據常常被描述成已經大到無法用傳統的數據處理工具進 ...
  • 轉Spark,一種快速數據分析替代方案
    Spark 是一種與 Hadoop 相似的開源集群計算環境,但是兩者之間還存在一些不同之處,這些有用的不同之處使 Spark 在某些工作負載方面表現得更加優越,換句話說,Spark 啓用了記憶體分布數據集,除了能夠提供交互式查詢外,它還可以優化疊代工作負載.Spark 是在 Scala 語言中實現的 ...
  • R數據分析及可視化的一個簡單例子
    需求分析葡萄牙某銀行擬根據現有客戶資料建立預測模型,以配合其數據庫營銷策略,營銷方式爲電話直銷,銷售産品爲某金融産品(term deposit),數據分析的目標爲通過預測模型識別對該金融産品有較高購買意願的用戶群.  數據形式:從數據庫中導出的excel文件數據內容: # bank client d ...
一周排行