U ]▀<`m\у@s*dZddlZz ejZWn4ek rJddlZeаdejбddДZYnXddДZejа бdZ eаe бZGd d Дd ГZ ddДZd dДZddДZd4ddДZdZd5ddДZddДZddДZddДZd6ddДZddДZd7d d!ДZd"d#ДZd$d%ДZd&d'ДZd(d)ДZd*d+ДZd,d-ДZd.d/ДZ d0d1ДZ!d2d3ДZ"dS)8a╕A state-emitting MarkovModel. Note terminology similar to Manning and Schutze is used. Functions: train_bw Train a markov model using the Baum-Welch algorithm. train_visible Train a visible markov model using MLE. find_states Find the a state sequence that explains some observations. load Load a MarkovModel. save Save a MarkovModel. Classes: MarkovModel Holds the description of a markov model щNzVFor optimal speed, please update to Numpy version 1.3 or later (current version is %s)cCsP||dkr|S||dkr |St||Г}|tаtа||бtа||ббS)z>Implement logaddexp method if Numpy version is older than 1.3.щd)┌min┌numpy┌log┌exp)ZlogxZlogyZminxyйr·.lib/python3.8/site-packages/Bio/MarkovModel.py┌ logaddexp*s r cCs@i}t|dddЕГ}t|Гd}|D]\}}||||<q&|S)zAReturn a dictionary of values with their sequence offset as keys.Nщ щ)┌ enumerate┌len)┌values┌d┌entries┌n┌index┌keyrrr┌ itemindex4srgYє°┬nеc@s"eZdZdZdddДZddДZdS)┌MarkovModelz+Create a state-emitting MarkovModel object.NcCs"||_||_||_||_||_dS)zInitialize the class.N)┌states┌alphabet┌ p_initial┌p_transition┌ p_emission)┌selfrrrrrrrr┌__init__Gs zMarkovModel.__init__cCs.ddlm}|Г}t||Г|аdб|абS)z9Create a string representation of the MarkovModel object.r)┌StringIO)┌ior┌save┌seek┌read)rr┌handlerrr┌__str__Qs zMarkovModel.__str__)NNN)┌__name__┌ __module__┌__qualname__┌__doc__rr#rrrrrDs rcCs&|аб}|а|бs"td||fГВ|S)zNRead the first line and evaluate that begisn with the correct start (PRIVATE).zI expected %r but got %r)┌readline┌ startswith┌ ValueError)r"┌start┌linerrr┌_readline_and_check_start[s r-cCsrt|dГ}|абddЕ}t|dГ}|абddЕ}t||Г}t|Гt|Г}}tа|б|_t|dГ}tt|ГГD],}t|d||Г}t|абdГ|j|<qrtа||fб|_ t|dГ}tt|ГГD]>}t|d||Г}d d Д|абddЕDГ|j |ddЕf<q╞tа||fб|_ t|dГ}tt|ГГD]@}t|d||Г}dd Д|абddЕDГ|j |ddЕf<Рq,|S) z.Parse a file handle into a MarkovModel object.zSTATES:rNz ALPHABET:zINITIAL:z %s:r zTRANSITION:cSsg|]}t|ГСqSrй┌floatй┌.0┌vrrr┌ |szload..z EMISSION:cSsg|]}t|ГСqSrr.r0rrrr3Гs)r-┌splitrr r┌zerosr┌ranger/rr)r"r,rr┌mm┌N┌M┌irrr┌loadcs, * ,r;c Cs·|j}|ddа|jбГ|ddа|jбГ|dГtt|jГГD] }|d|j||j|fГqD|dГtt|jГГD]0}|d|j|dаdd Д|j|DГбfГq||d Гtt|jГГD]0}|d|j|dаdd Д|j|DГбfГq─dS) z$Save MarkovModel object into handle.zSTATES: %s · z ALPHABET: %s z INITIAL: z %s: %g zTRANSITION: z %s: %s css|]}t|ГVqdSйNй┌strйr1┌xrrr┌ Уszsave..z EMISSION: css|]}t|ГVqdSr=r>r@rrrrBЦsN) ┌write┌joinrrr6r rrr)r7r"┌wr:rrrrИs.rc st|Гt|Г}}|stdГВ|dk rDtа|б}|j|fkrDtdГВ|dk rltа|б}|j||fkrltdГВ|dk rФtа|б}|j||fkrФtdГВg} t|ГЙ|D]} | аЗfddД| DГбqдddД| DГ}t|Гd krфtd ГВt||| ||||dН}|\} }}t ||| ||ГS)aTrain a MarkovModel using the Baum-Welch algorithm. Train a MarkovModel using the Baum-Welch algorithm. states is a list of strings that describe the names of each state. alphabet is a list of objects that indicate the allowed outputs. training_data is a list of observations. Each observation is a list of objects from the alphabet. pseudo_initial, pseudo_transition, and pseudo_emission are optional parameters that you can use to assign pseudo-counts to different matrices. They should be matrices of the appropriate size that contain numbers to add to each parameter matrix, before normalization. update_fn is an optional callback that takes parameters (iteration, log_likelihood). It is called once per iteration. zNo training data given.N·$pseudo_initial not shape len(states)·5pseudo_transition not shape len(states) X len(states)·5pseudo_emission not shape len(states) X len(alphabet)csg|]}И|СqSrrr@й┌indexesrrr3╩sztrain_bw..cSsg|]}t|ГСqSr)r r@rrrr3═srz,I got training data with outputs of length 0)┌pseudo_initial┌pseudo_transition┌pseudo_emission┌ update_fn) r r*r┌asarray┌shaper┌appendr┌_baum_welchr)rr┌ training_datarKrLrMrNr8r9┌training_outputs┌outputsZlengthsrArrrrrIr┌train_bwЪsB ∙ rViшc Csd|dkrt|Г}nt||fГ}|dkr4t||fГ}nt|||fГ}|dkrXt||fГ}nt|||fГ}tа|б} tа|б}tа|б}|dk rШtа|б} nd} |dk r░tа|б}nd}|dk r╚tа|б}nd}d}ttГD]j}t}|D] }|t|||| ||| ||Г 7}qф| dk Рr| ||Г|dk Рr>tа||бdkРr>РqP|}q╪t dtГВddД| ||fDГS)zfImplement the Baum-Welch algorithm to evaluate unknown parameters in the MarkovModel object (PRIVATE).NgЪЩЩЩЩЩ╣?z%HMM did not converge in %d iterationscSsg|]}tа|бСqSr)rr)r1┌_rrrr3)sz_baum_welch..) ┌_random_norm┌_copy_and_checkrrr6┌MAX_ITERATIONS┌LOG0┌_baum_welch_one┌fabs┌RuntimeError)r8r9rTrrrrKrLrMrN┌ lp_initial┌ lp_transition┌lp_emission┌lpseudo_initial┌lpseudo_transition┌lpseudo_emissionZ prev_llikr:ZllikrUrrrrRтsV ў rRc Cs▓t|Г} t|| ||||Г} t|| |||Г}tа||| fб}t| ГD]Ф} || }tа||fб}t|ГD]R}t|ГD]D}| || ||||||||| d}||||<qpqd|t|Г|ddЕddЕ| f<qBtа|| fб}t| ГD]0} t|ГD]"}t||ddЕ| fГ||| <q·qюtа|б}t|ГD]}t||ddЕfГ||<Рq2|ddЕdf}|dk РrВt||Г}|t|Г}t|ГD]p}t|ГD],}t|||ddЕfГ|||||<РqЦ|dk РrКt|||Г||<||t||Г||<РqКt|ГD]Ш}tа|бt}t| ГD]:} || }t|ГD]"}t |||||| fГ||<Рq2Рq|t|Г}|dk РrКt|||Г}|t|Г}|||ddЕf<Рqt| ddЕ| fГS)z╩Execute one step for Baum-Welch algorithm (PRIVATE). Do one iteration of Baum-Welch based on a sequence of output. Changes the value for lp_initial, lp_transition and lp_emission in place. rNr) r ┌_forward┌ _backwardrr5r6┌_logsum┌ _logvecaddr[r )r8r9rUr_r`rarbrcrd┌TZfmatZbmatZlp_arc┌t┌kZlp_traverser:┌j┌lpZlp_arcout_tZ lp_arcoutZksumrrrr\,s` ■¤ " * $ r\c Csдtа||dfб}||ddЕdf<td|dГD]n}||d}t|ГD]T} t} t|ГD]6}|||d||| |||}t| |Г} qX| || |<qHq0|S)zОImplement forward algorithm (PRIVATE). Calculate a Nx(T+1) matrix, where the last column is the total probability of the output. rNrйrr5r6r[r ) r8rir_r`rarU┌matrixrjrkrl┌lprobr:rmrrrreКs(recCsТtа||dfб}t|dddГD]j}||}t|ГD]T}t} t|ГD]6} || |d||| |||}t| |Г} qF| |||<q6q"|S)z'Implement backward algorithm (PRIVATE).rr rn)r8rir`rarUrorjrkr:rprlrmrrrrfбs(rfcs&t|Гt|Г}}|dk r8tа|б}|j|fkr8tdГВ|dk r`tа|б}|j||fkr`tdГВ|dk rИtа|б}|j||fkrИtdГВgg}} t|ГЙt|ГЙ|D]P\} }t|Гt| Гkr╞tdГВ|аЗfddД|DГб| аЗfddД| DГбqжt||| ||||Г}|\} }}t||| ||ГS) a Train a visible MarkovModel using maximum likelihoood estimates for each of the parameters. Train a visible MarkovModel using maximum likelihoood estimates for each of the parameters. states is a list of strings that describe the names of each state. alphabet is a list of objects that indicate the allowed outputs. training_data is a list of (outputs, observed states) where outputs is a list of the emission from the alphabet, and observed states is a list of states from states. pseudo_initial, pseudo_transition, and pseudo_emission are optional parameters that you can use to assign pseudo-counts to different matrices. They should be matrices of the appropriate size that contain numbers to add to each parameter matrix. NrFrGrHzstates and outputs not alignedcsg|]}И|СqSrrr@)┌states_indexesrrr3▀sz!train_visible..csg|]}И|СqSrrr@)┌outputs_indexesrrr3рs) r rrOrPr*rrQ┌_mler)rrrSrKrLrMr8r9┌training_statesrTZtoutputsZtstatesrArrrr)rrrqr┌ train_visible▒s@ ∙ rucCsШtа|б}|r||}|D]}||dd7<qt|Г}tа||fб} |rV| |} |D]D}tt|ГdГD].} || || d}}| ||fd7<qnqZtt| ГГD]4}| |ddЕft| |ddЕfГ| |ddЕf<qмtа||fб} |r№| |} tа||fб} t||ГD]4\}}t||ГD]\}}| ||fd7<Рq&Рqtt| ГГD]6}| |ddЕft| |ddЕfГ| |ddЕf<РqV|| | fS)z.csg|]}Иj|СqSr)rr@)r7rrr39s) r rrrr┌VERY_SMALL_NUMBERrrrr┌_viterbir6r) Zmarkov_model┌outputr8r_r`ra┌resultsr:r┌scorer)rJr7r┌find_states#s "rВcCsТt|Г}g}t|ГD]}|аdg|бqtа||fб}||ddЕ|df|ddЕdf<td|ГD]r} || } t|ГD]\}|ddЕ| df|ddЕ|f||| f}t|Г} || d||| f<| ||| <qzqfg}g}t|ddЕ|dfГ} | D]&}|а|d|g|||dfбq■|РrО|аб\} }}| dkРrT|а||fбn6||d| } | D] }|а| d|g||fбРqhРq&|S)zSImplement Viterbi algorithm to find most likely states for a given input (PRIVATE).Nrr)r r6rQrr5r|┌pop)r8r_r`rarriZ backtracer:ZscoresrjrkrlZi_scoresrJZ in_processrАrrБrrrr~=s4$0$ "r~cCs~t|jГdkr |tt|ГГ}nZt|jГdkrrtt|ГГD]4}||ddЕft||ddЕfГ||ddЕf<q:ntdГВ|S)z"Normalize matrix object (PRIVATE).rщNz&I cannot handle matrixes of that shape)r rPr/rwr6r*)ror:rrrrvfs4rvcCstа|б}t|ГS)z%Normalize a uniform matrix (PRIVATE).)rrxrvйrProrrr┌ _uniform_normss rЖcCstjа|б}t|ГS)z$Normalize a random matrix (PRIVATE).)r┌randomrvrЕrrrrXysrXcCsвtj|ddН}|j|kr tdГВt|jГdkrNtаt|ГdбdkrЮtdГВnPt|jГdkrЦtt|ГГD]*}tаt||Гdбdkrhtd|ГВqhntd ГВ|S) zFCopy a matrix and check its dimension. Normalize at the end (PRIVATE).r)┌copyzIncorrect dimensiongЁ?g{оGсzД?zmatrix not normalized to 1.0rДzmatrix %d not normalized to 1.0z&I don't handle matrices > 2 dimensions)rZarrayrPr*r r]rwr6)roZ desired_shaper:rrrrYs rYcCsFt|jГdkr&tа|tа|jбfб}n|}t}|D]}t||Г}q2|S)z/Implement logsum for a matrix object (PRIVATE).r)r rPrZreshape┌productr[r )roZvecrwZnumrrrrgУsrgcCsRt|Гt|ГkstdГВtаt|Гб}tt|ГГD]}t||||Г||<q2|S)z5Implement a log sum for two vector objects (PRIVATE).zvectors aren't the same length)r ┌AssertionErrorrr5r6r )Zlogvec1Zlogvec2Zsumvecr:rrrrhЯs rhcCst|Г}tа|бS)z-Return the exponential of a logsum (PRIVATE).)rgrr)Znumbersrwrrr┌_exp_logsumиsrЛ)NNNN)NNNNNNN)NNN)N)#r'rr ┌AttributeError┌warnings┌warn┌__version__rrЗZseedr}rr[rr-r;rrVrZrRr\rerfrursr|rВr~rvrЖrXrYrgrhrЛrrrr┌sf %∙ EЎ J^· ?. )