當前位置: 華文問答 > 科學

怎麽通俗易懂地解釋貝葉斯網路和它的套用?

2015-02-05科學

我自己找到一篇很通俗易懂的案例

英語原文:

http://www. norsys.com/tutorials/ne tica/secA/tut_A1.htm

以下內容摘錄自www.norsys.com,根據例項內容意譯譯文。

貝葉斯網路套用例項一:胸部疾病診所(Chest Clinic)

假想你是Los Angeles一名新畢業的醫生,專攻肺部疾病。你決定建立一個胸部疾病診所,主治肺病及相關疾病。大學課本已經中告訴你了肺癌、肺結核和支氣管炎的發生比率以及這些疾病典型的臨床癥狀、病因等,於是你就可以根據課本裏的理論知識建立自己的Bayes網。如根據如下數據資訊:

  • 美國有30%的人吸煙.
  • 每10萬人中就就有70人患有肺癌.
  • 每10萬人中就就有10人患有肺結核.
  • 每10萬人中就就有800人患有支氣管炎.
  • 10%人存在呼吸困難癥狀, 大部份人是哮喘、支氣管炎和其他非肺結核、非肺癌性疾病引起.
  • 根據上面的數據可以建立如下BN模型:

    這樣的一個BN模型對你意義不大,因為它沒有用到來你診所病人的案例數據,不能反映真實病人的情況。當診所診治了數千病人後,會發現課本中所描述的北美的情況與實際診所數據顯示的情況是完全不同的,實際診所數據顯示:

  • 50%的病人吸煙.
  • 1%患有肺結核.
  • 5.5% 得了肺癌.
  • 45% 患有不同程度支氣管炎.
    將這些新數據輸入到BN模型中,才真正的獲得了對你有意義的實用BN模型:

  • 現在,看看如何在日常診斷中用該BN模型。

  • 首先,應該註意到,上述模型反映了一個來診所求醫的新患者,為診斷之前我們沒有這個患者的任何資訊。而當我們向患者咨詢資訊時,BN網中的機率就會自動調整,這就是貝葉斯推理最完美、強大之處。貝葉斯網路最強大之處在於從每個階段結果所獲得的機率都是數學與科學的反映,換句話說,假設我們了解了患者的足夠資訊,根據這些資訊獲得統計知識,網路就會告訴我們合理的推斷。
  • 現在看看如何增加個別病人資訊調節機率。一個女病人進入診所,我們開始和她談論。她告訴我們她呼吸困難。我們將這個資訊輸入到網路。我們相信病人的資訊,認為其存在100%呼吸困難。

    可以觀察到,一旦病人有呼吸困難癥狀,三種疾病的機率都增大了,因為這些疾病都有呼吸困難的癥狀。我們的病人存在這樣的癥狀,某種程度上我們會推斷這三種疾病可能性比較大,也增加了我們患者有嚴重疾病認識的信念。

  • 仔細看看推斷的過程:
    1. 明顯增大的是支氣管炎,從 45% 到 83.4%. 為什麽會有如此大的增長呢?因為支氣管炎病比癌癥和肺結核更常見. 只要我們相信患者有嚴重的肺部疾病,那最支氣管炎的可能性會更大些。
    2. 病人是抽煙者的機率也會隨之增大,從50% 到63.4%.
    3. 近期存取過亞洲的機率也會增大: 從1% 到1.03%, 顯然是不重要的.
    4. X光照片不正常的機率也會上漲,從11% 到16%.

    知道現在我們還無法確認什麽疾病困擾著我們的這個女患者,我們目前比較相信她患有支氣管炎的可能性很大,但是,我們應該獲得更多資訊來確定我們的判斷,如果我們現在就主觀定了病癥,她可能得的是癌癥,那我們就是一個爛醫生。這就需要更多資訊來做最後的決定。
    因此,我們按照流程依此問她一些問題,如她最近是不是去過亞洲國家,吃驚的是她回答了「是」。現在獲得的資訊就影響了BN模型。

  • 患肺結核的機率顯然增大,從 2%到 9%. 而患有癌癥、支氣管炎以及該患者是吸煙患者的機率都有所減少。為什麽呢?因為此時呼吸困難的原因相對更傾向於肺結核。
  • 繼續問患者一些問題,假設患者是個吸煙者,則網路變為

    此時註意到最好的假設仍然是認為患者患有支氣管炎。為了確認我們要求她做一個X光透視,結果顯示其正常。結果如下:

  • 這就更加肯定我們的推斷她患有支氣管炎。
  • 如果X光顯示不正常的話,則結果將有很大不同:
  • 註意最大的區別。結核病或肺癌增加的機率極大。支氣管炎仍然是三個獨立的疾病中最可能的一個,但它小於"結核或肺癌"這一組合的假設。所以,我們將決定進行進一步測試,血液測試,肺組織活檢,等等。我們當前的貝葉斯網不包括這些測試,但它很容易擴充套件,只需添加額外的節點作為我們獲得新的統計數據的診斷程式。我們不需要扔掉以前的任何部份。這是貝葉斯網的另一個強大的功能。他們很容易擴充套件(或減少,簡化),以適應不斷變化的需求和變化的知識。

    總結

    在本節中,我們了解到,貝葉斯網路是一個用嚴格的數學方法來模擬一個世界的方法,是靈活的,適應於任何你擁有的知識程度的方法,同時也是計算效率的方法。

    本文參照地址:http://blog.sciencenet.cn/blog-82650-255141.html 此文來自科學網邱士利部落格

    最後說下,這篇文章用到了一個叫做netica的軟體,各位有需要的可以在這裏下載

    連結:

    百度雲 請輸入提取密碼

    密碼: 1qav

    -------------20170127更新

    鑒於大家都想對貝葉斯網路進一步了解,這裏推薦一些資料:

    【貝葉斯網引論】連結:

    https:// pan.baidu.com/s/1qYxvvd U

    密碼: 7iv8

    netica官方文件

    http://www. norsys.com/WebHelp/NETI CA.htm

    R語言貝葉斯網路的包

    Bayesian network structure learning

    R語言pcalg包

    CRAN - Package pcalg