Ë
    «q±iC¥  ã                   ó@  — d Z ddlZddlZddlmZ ddlmZmZmZ ddlm	Z
 ddlmZ ddlmZ dd	lmZmZmZmZmZ dd
lmZ ddlmZ ddlmZmZ ddlmZ  ej<                  e«      Z  G d„ dejB                  «      Z" G d„ dejB                  «      Z# G d„ dejB                  «      Z$ G d„ dejB                  «      Z% G d„ dejB                  «      Z& G d„ dejB                  «      Z' G d„ dejB                  «      Z( G d„ de«      Z) G d„ d ejB                  «      Z* G d!„ d"ejB                  «      Z+e G d#„ d$e«      «       Z,e G d%„ d&e,«      «       Z- ed'¬(«       G d)„ d*e,«      «       Z.e G d+„ d,e,«      «       Z/ G d-„ d.ejB                  «      Z0e G d/„ d0e,«      «       Z1g d1¢Z2y)2zPyTorch LiLT model.é    N)Únn)ÚBCEWithLogitsLossÚCrossEntropyLossÚMSELossé   )Úinitialization)ÚACT2FN)ÚGradientCheckpointingLayer)ÚBaseModelOutputÚBaseModelOutputWithPoolingÚQuestionAnsweringModelOutputÚSequenceClassifierOutputÚTokenClassifierOutput)ÚPreTrainedModel)Úapply_chunking_to_forward)Úauto_docstringÚloggingé   )Ú
LiltConfigc                   ó:   ‡ — e Zd Zˆ fd„Z	 	 	 	 dd„Zd„ Zd„ Zˆ xZS )ÚLiltTextEmbeddingsc                 ó  •— t         ‰|   «        t        j                  |j                  |j
                  |j                  ¬«      | _        t        j                  |j                  |j
                  «      | _	        t        j                  |j                  |j
                  «      | _        t        j                  |j
                  |j                  ¬«      | _        t        j                  |j                  «      | _        | j#                  dt%        j&                  |j                  «      j)                  d«      d¬«       |j                  | _        t        j                  |j                  |j
                  | j*                  ¬«      | _	        y )N©Úpadding_idx©ÚepsÚposition_ids©r   éÿÿÿÿF)Ú
persistent)ÚsuperÚ__init__r   Ú	EmbeddingÚ
vocab_sizeÚhidden_sizeÚpad_token_idÚword_embeddingsÚmax_position_embeddingsÚposition_embeddingsÚtype_vocab_sizeÚtoken_type_embeddingsÚ	LayerNormÚlayer_norm_epsÚDropoutÚhidden_dropout_probÚdropoutÚregister_bufferÚtorchÚarangeÚexpandr   ©ÚselfÚconfigÚ	__class__s     €úX/opt/pipecat/venv/lib/python3.12/site-packages/transformers/models/lilt/modeling_lilt.pyr"   zLiltTextEmbeddings.__init__*   s  ø€ Ü‰ÑÔÜ!Ÿ|™|¨F×,=Ñ,=¸v×?QÑ?QÐ_e×_rÑ_rÔsˆÔÜ#%§<¡<°×0NÑ0NÐPV×PbÑPbÓ#cˆÔ Ü%'§\¡\°&×2HÑ2HÈ&×J\ÑJ\Ó%]ˆÔ"äŸ™ f×&8Ñ&8¸f×>SÑ>SÔTˆŒÜ—z‘z &×"<Ñ"<Ó=ˆŒð 	×ÑØœEŸL™L¨×)GÑ)GÓH×OÑOÐPWÓXÐejð 	ô 	
ð
 "×.Ñ.ˆÔÜ#%§<¡<Ø×*Ñ*¨F×,>Ñ,>ÈD×L\ÑL\ô$
ˆÕ ó    c                 ó&  — |€I|6| j                  || j                  «      j                  |j                  «      }n| j	                  |«      }||j                  «       }n|j                  «       d d }|€:t        j                  |t        j                  | j                  j                  ¬«      }|€| j                  |«      }| j                  |«      }||z   }| j                  |«      }||z  }| j                  |«      }| j                  |«      }||fS )Nr   ©ÚdtypeÚdevice)Ú"create_position_ids_from_input_idsr   Útor>   Ú&create_position_ids_from_inputs_embedsÚsizer2   ÚzerosÚlongr   r'   r+   r)   r,   r0   )	r6   Ú	input_idsÚtoken_type_idsr   Úinputs_embedsÚinput_shaper+   Ú
embeddingsr)   s	            r9   ÚforwardzLiltTextEmbeddings.forward>   s  € ð ÐØÐ$à#×FÑFÀyÐRV×RbÑRbÓc×fÑfØ×$Ñ$ó ‘ð  $×JÑJÈ=ÓYàÐ Ø#Ÿ.™.Ó*‰Kà'×,Ñ,Ó.¨s°Ð3ˆKàÐ!Ü"Ÿ[™[¨¼E¿J¹JÈt×O`ÑO`×OgÑOgÔhˆNàÐ Ø ×0Ñ0°Ó;ˆMØ $× :Ñ :¸>Ó JÐØ"Ð%:Ñ:ˆ
à"×6Ñ6°|ÓDÐØÐ)Ñ)ˆ
à—^‘^ JÓ/ˆ
Ø—\‘\ *Ó-ˆ
Ø˜<Ð'Ð'r:   c                 ó¸   — |j                  |«      j                  «       }t        j                  |d¬«      j	                  |«      |z  }|j                  «       |z   S )a  
        Args:
        Replace non-padding symbols with their position numbers. Position numbers begin at padding_idx+1. Padding
        symbols are ignored. This is modified from fairseq's `utils.make_positions`.
            x: torch.Tensor x:
        Returns: torch.Tensor
        r   ©Údim)ÚneÚintr2   ÚcumsumÚtype_asrD   )r6   rE   r   ÚmaskÚincremental_indicess        r9   r?   z5LiltTextEmbeddings.create_position_ids_from_input_idsb   sP   € ð |‰|˜KÓ(×,Ñ,Ó.ˆÜ$Ÿ|™|¨D°aÔ8×@Ñ@ÀÓFÈ$ÑNÐØ"×'Ñ'Ó)¨KÑ7Ð7r:   c                 ó  — |j                  «       dd }|d   }t        j                  | j                  dz   || j                  z   dz   t        j                  |j
                  ¬«      }|j                  d«      j                  |«      S )zÖ
        Args:
        We are provided embeddings directly. We cannot infer which are padded so just generate sequential position ids.:
            inputs_embeds: torch.Tensor
        Returns: torch.Tensor
        Nr   r   r<   r   )rB   r2   r3   r   rD   r>   Ú	unsqueezer4   )r6   rG   rH   Úsequence_lengthr   s        r9   rA   z9LiltTextEmbeddings.create_position_ids_from_inputs_embedso   s€   € ð $×(Ñ(Ó*¨3¨BÐ/ˆØ% a™.ˆä—|‘|Ø×Ñ˜qÑ  /°D×4DÑ4DÑ"DÀqÑ"HÔPU×PZÑPZÐcp×cwÑcwô
ˆð ×%Ñ% aÓ(×/Ñ/°Ó<Ð<r:   )NNNN)Ú__name__Ú
__module__Ú__qualname__r"   rJ   r?   rA   Ú__classcell__©r8   s   @r9   r   r   )   s&   ø„ ô
ð, ØØØó"(òH8ö=r:   r   c                   ó&   ‡ — e Zd Zˆ fd„Zdd„Zˆ xZS )ÚLiltLayoutEmbeddingsc                 ó   •— t         ‰|   «        t        j                  |j                  |j
                  dz  «      | _        t        j                  |j                  |j
                  dz  «      | _        t        j                  |j                  |j
                  dz  «      | _        t        j                  |j                  |j
                  dz  «      | _	        |j                  | _        t        j                  |j                  |j
                  |j                  z  | j                  ¬«      | _        t        j                  |j
                  |j
                  |j                  z  ¬«      | _        t        j"                  |j
                  |j                  z  |j$                  ¬«      | _        t        j&                  |j(                  «      | _        y )Né   r   )Úin_featuresÚout_featuresr   )r!   r"   r   r#   Úmax_2d_position_embeddingsr%   Úx_position_embeddingsÚy_position_embeddingsÚh_position_embeddingsÚw_position_embeddingsr&   r   r(   Úchannel_shrink_ratioÚbox_position_embeddingsÚLinearÚbox_linear_embeddingsr,   r-   r.   r/   r0   r5   s     €r9   r"   zLiltLayoutEmbeddings.__init__€   s^  ø€ Ü‰ÑÔô &(§\¡\°&×2SÑ2SÐU[×UgÑUgÐklÑUlÓ%mˆÔ"Ü%'§\¡\°&×2SÑ2SÐU[×UgÑUgÐklÑUlÓ%mˆÔ"Ü%'§\¡\°&×2SÑ2SÐU[×UgÑUgÐklÑUlÓ%mˆÔ"Ü%'§\¡\°&×2SÑ2SÐU[×UgÑUgÐklÑUlÓ%mˆÔ"à!×.Ñ.ˆÔÜ')§|¡|Ø×*Ñ*Ø×Ñ &×"=Ñ"=Ñ=Ø×(Ñ(ô(
ˆÔ$ô
 &(§Y¡YØ×*Ñ*¸×9KÑ9KÈv×OjÑOjÑ9jô&
ˆÔ"ô Ÿ™ f×&8Ñ&8¸F×<WÑ<WÑ&WÐ]c×]rÑ]rÔsˆŒÜ—z‘z &×"<Ñ"<Ó=ˆr:   c                 ó†  — 	 | j                  |d d …d d …df   «      }| j                  |d d …d d …df   «      }| j                  |d d …d d …df   «      }| j                  |d d …d d …df   «      }| j                  |d d …d d …df   |d d …d d …df   z
  «      }| j	                  |d d …d d …df   |d d …d d …df   z
  «      }	t        j                  ||||||	gd¬«      }
| j                  |
«      }
| j                  |«      }|
|z   }
| j                  |
«      }
| j                  |
«      }
|
S # t        $ r}t        d«      |‚d }~ww xY w)Nr   r   é   r   z;The `bbox` coordinate values should be within 0-1000 range.r   rL   )rc   rd   Ú
IndexErrorre   rf   r2   Úcatrj   rh   r,   r0   )r6   Úbboxr   Úleft_position_embeddingsÚupper_position_embeddingsÚright_position_embeddingsÚlower_position_embeddingsÚere   rf   Úspatial_position_embeddingsrh   s               r9   rJ   zLiltLayoutEmbeddings.forward•   sw  € ð	cØ'+×'AÑ'AÀ$ÂqÊ!ÈQÀwÁ-Ó'PÐ$Ø(,×(BÑ(BÀ4ÊÊ1ÈaÈÁ=Ó(QÐ%Ø(,×(BÑ(BÀ4ÊÊ1ÈaÈÁ=Ó(QÐ%Ø(,×(BÑ(BÀ4ÊÊ1ÈaÈÁ=Ó(QÐ%ð !%× :Ñ :¸4ÂÂ1ÀaÀ¹=È4ÒPQÒSTÐVWÐPWÉ=Ñ;XÓ YÐØ $× :Ñ :¸4ÂÂ1ÀaÀ¹=È4ÒPQÒSTÐVWÐPWÉ=Ñ;XÓ YÐä&+§i¡ià(Ø)Ø)Ø)Ø%Ø%ðð ô
'
Ð#ð '+×&@Ñ&@ÐA\Ó&]Ð#Ø"&×">Ñ">¸|Ó"LÐà&AÐD[Ñ&[Ð#à&*§n¡nÐ5PÓ&QÐ#Ø&*§l¡lÐ3NÓ&OÐ#à*Ð*øô3 ò 	cÜÐZÓ[ÐabÐbûð	cús   ‚A,D& Ä&	E Ä/D;Ä;E )NN)rW   rX   rY   r"   rJ   rZ   r[   s   @r9   r]   r]      s   ø„ ô>÷*+r:   r]   c                   ó4   ‡ — e Zd Zdˆ fd„	Zdd„Z	 	 dd„Zˆ xZS )ÚLiltSelfAttentionc                 ó²  •— t         ‰|   «        |j                  |j                  z  dk7  r2t	        |d«      s&t        d|j                  › d|j                  › d«      ‚|j                  | _        t        |j                  |j                  z  «      | _        | j                  | j                  z  | _        t        j                  |j                  | j                  «      | _        t        j                  |j                  | j                  «      | _        t        j                  |j                  | j                  «      | _        t        j                  |j                  |j                  z  | j                  |j                  z  «      | _        t        j                  |j                  |j                  z  | j                  |j                  z  «      | _        t        j                  |j                  |j                  z  | j                  |j                  z  «      | _        t        j$                  |j&                  «      | _        |j                  | _        || _        y )Nr   Úembedding_sizezThe hidden size (z6) is not a multiple of the number of attention heads (ú))r!   r"   r%   Únum_attention_headsÚhasattrÚ
ValueErrorrO   Úattention_head_sizeÚall_head_sizer   ri   ÚqueryÚkeyÚvaluerg   Úlayout_queryÚ
layout_keyÚlayout_valuer.   Úattention_probs_dropout_probr0   Ú	layer_idx)r6   r7   r‡   r8   s      €r9   r"   zLiltSelfAttention.__init__¸   sá  ø€ Ü‰ÑÔØ×Ñ × :Ñ :Ñ:¸aÒ?ÌÐPVÐXhÔHiÜØ# F×$6Ñ$6Ð#7ð 8Ø ×4Ñ4Ð5°Qð8óð ð
 $*×#=Ñ#=ˆÔ Ü#& v×'9Ñ'9¸F×<VÑ<VÑ'VÓ#WˆÔ Ø!×5Ñ5¸×8PÑ8PÑPˆÔä—Y‘Y˜v×1Ñ1°4×3EÑ3EÓFˆŒ
Ü—9‘9˜V×/Ñ/°×1CÑ1CÓDˆŒÜ—Y‘Y˜v×1Ñ1°4×3EÑ3EÓFˆŒ
äŸI™IØ×Ñ &×"=Ñ"=Ñ=¸t×?QÑ?QÐU[×UpÑUpÑ?pó
ˆÔô Ÿ)™)Ø×Ñ &×"=Ñ"=Ñ=¸t×?QÑ?QÐU[×UpÑUpÑ?pó
ˆŒô ŸI™IØ×Ñ &×"=Ñ"=Ñ=¸t×?QÑ?QÐU[×UpÑUpÑ?pó
ˆÔô —z‘z &×"EÑ"EÓFˆŒà$*×$?Ñ$?ˆÔ!Ø"ˆr:   c                 ó¦   — |j                  «       d d | j                  | j                  |z  fz   } |j                  |Ž }|j	                  dddd«      S )Nr   r   rl   r   r   )rB   r{   r~   ÚviewÚpermute)r6   ÚxÚrÚnew_x_shapes       r9   Útranspose_for_scoresz&LiltSelfAttention.transpose_for_scores×   sT   € Ø—f‘f“h˜s m t×'?Ñ'?À×AYÑAYÐ]^ÑA^Ð&_Ñ_ˆØˆAF‰FKÐ ˆØy‰y˜˜A˜q !Ó$Ð$r:   c                 óÂ  — | j                  | j                  |«      | j                  ¬«      }| j                  | j                  |«      | j                  ¬«      }| j                  | j	                  |«      | j                  ¬«      }| j                  |«      }| j                  | j                  |«      «      }	| j                  | j                  |«      «      }
| j                  |«      }t        j                  ||	j                  dd«      «      }t        j                  ||j                  dd«      «      }|t        j                  | j                  «      z  }|t        j                  | j                  | j                  z  «      z  }||z   }||z   }|||z   } t        j                  d¬«      |«      }| j!                  |«      }t        j                  ||«      }|j#                  dddd«      j%                  «       }|j'                  «       d d | j(                  | j                  z  fz   } |j*                  |Ž }|||z   } t        j                  d¬«      |«      }| j!                  |«      }t        j                  ||
«      }|j#                  dddd«      j%                  «       }|j'                  «       d d | j(                  fz   } |j*                  |Ž }||f}|r||fz   }|S )	N)rŒ   r   éþÿÿÿrL   r   rl   r   r   )rŽ   r…   rg   r„   rƒ   r€   r   r‚   r2   ÚmatmulÚ	transposeÚmathÚsqrtr~   r   ÚSoftmaxr0   rŠ   Ú
contiguousrB   r   r‰   )r6   Úhidden_statesÚlayout_inputsÚattention_maskÚoutput_attentionsÚlayout_value_layerÚlayout_key_layerÚlayout_query_layerÚmixed_query_layerÚ	key_layerÚvalue_layerÚquery_layerÚattention_scoresÚlayout_attention_scoresÚtmp_attention_scoresÚtmp_layout_attention_scoresÚlayout_attention_probsÚlayout_context_layerÚnew_context_layer_shapeÚattention_probsÚcontext_layerÚoutputss                         r9   rJ   zLiltSelfAttention.forwardÜ   sÞ  € ð "×6Ñ6°t×7HÑ7HÈÓ7WÐ[_×[tÑ[tÐ6ÓuÐØ×4Ñ4°T·_±_À]Ó5SÐW[×WpÑWpÐ4ÓqÐØ!×6Ñ6°t×7HÑ7HÈÓ7WÐ[_×[tÑ[tÐ6ÓuÐà ŸJ™J }Ó5Ðà×-Ñ-¨d¯h©h°}Ó.EÓFˆ	Ø×/Ñ/°·
±
¸=Ó0IÓJˆØ×/Ñ/Ð0AÓBˆä Ÿ<™<¨°Y×5HÑ5HÈÈRÓ5PÓQÐÜ"'§,¡,Ð/AÐCS×C]ÑC]Ð^`ÐbdÓCeÓ"fÐà/´$·)±)¸D×<TÑ<TÓ2UÑUÐØ&=ÄÇ	Á	Ø×$Ñ$¨×(AÑ(AÑAóA
ñ '
Ð#ð 0Ð2MÑMÐØ"=Ð@TÑ"TÐàÐ%à&=ÀÑ&NÐ#ð "4¤§¡°Ô!3Ð4KÓ!LÐð "&§¡Ð.DÓ!EÐä$Ÿ|™|Ð,BÐDVÓWÐà3×;Ñ;¸A¸qÀ!ÀQÓG×RÑRÓTÐØ"6×";Ñ";Ó"=¸c¸rÐ"BÀd×FXÑFXÐ\`×\uÑ\uÑFuÐEwÑ"wÐØ8Ð3×8Ñ8Ð:QÐRÐàÐ%à/°.Ñ@Ðð -œ"Ÿ*™*¨Ô,Ð-=Ó>ˆð Ÿ,™, Ó7ˆäŸ™ _°kÓBˆà%×-Ñ-¨a°°A°qÓ9×DÑDÓFˆØ"/×"4Ñ"4Ó"6°s¸Ð";¸t×?QÑ?QÐ>SÑ"SÐØ*˜×*Ñ*Ð,CÐDˆà Ð"6Ð7ˆÙØ Ð 2Ñ2ˆGàˆr:   ©N)r   ©NF)rW   rX   rY   r"   rŽ   rJ   rZ   r[   s   @r9   rw   rw   ·   s   ø„ õ#ó>%ð Ø÷Ar:   rw   c                   ón   ‡ — e Zd Zˆ fd„Zdej
                  dej
                  dej
                  fd„Zˆ xZS )ÚLiltSelfOutputc                 ó(  •— t         ‰|   «        t        j                  |j                  |j                  «      | _        t        j                  |j                  |j                  ¬«      | _        t        j                  |j                  «      | _
        y ©Nr   )r!   r"   r   ri   r%   Údenser,   r-   r.   r/   r0   r5   s     €r9   r"   zLiltSelfOutput.__init__"  s`   ø€ Ü‰ÑÔÜ—Y‘Y˜v×1Ñ1°6×3EÑ3EÓFˆŒ
ÜŸ™ f×&8Ñ&8¸f×>SÑ>SÔTˆŒÜ—z‘z &×"<Ñ"<Ó=ˆr:   r—   Úinput_tensorÚreturnc                 ór   — | j                  |«      }| j                  |«      }| j                  ||z   «      }|S r¬   ©r²   r0   r,   ©r6   r—   r³   s      r9   rJ   zLiltSelfOutput.forward(  ó7   € ØŸ
™
 =Ó1ˆØŸ™ ]Ó3ˆØŸ™ }°|Ñ'CÓDˆØÐr:   ©rW   rX   rY   r"   r2   ÚTensorrJ   rZ   r[   s   @r9   r¯   r¯   !  ó1   ø„ ô>ð U§\¡\ð ÀÇÁð ÐRW×R^ÑR^÷ r:   r¯   c                   ó¤   ‡ — e Zd Zd	ˆ fd„	Z	 	 d
dej
                  dej
                  dej                  dz  dedz  deej
                     f
d„Z	ˆ xZ
S )ÚLiltAttentionNc                 óè   •— t         ‰|   «        t        ||¬«      | _        t	        |«      | _        |j                  }|j                  |j                  z  |_        t	        |«      | _        ||_        y )N©r‡   )	r!   r"   rw   r6   r¯   Úoutputr%   rg   Úlayout_output)r6   r7   r‡   Úori_hidden_sizer8   s       €r9   r"   zLiltAttention.__init__0  sa   ø€ Ü‰ÑÔÜ% f¸	ÔBˆŒ	Ü$ VÓ,ˆŒà ×,Ñ,ˆØ#×/Ñ/°6×3NÑ3NÑNˆÔÜ+¨FÓ3ˆÔØ,ˆÕr:   r—   r˜   r™   rš   r´   c                 ó–   — | j                  ||||«      }| j                  |d   |«      }| j                  |d   |«      }||f|dd  z   }|S )Nr   r   rl   )r6   rÀ   rÁ   )	r6   r—   r˜   r™   rš   Úself_outputsÚattention_outputÚlayout_attention_outputr«   s	            r9   rJ   zLiltAttention.forward:  sh   € ð —y‘yØØØØó	
ˆð  Ÿ;™; |°A¡¸ÓFÐØ"&×"4Ñ"4°\À!±_ÀmÓ"TÐØ#Ð%<Ð=ÀÈQÈRÐ@PÑPˆØˆr:   r¬   r­   )rW   rX   rY   r"   r2   rº   ÚFloatTensorÚboolÚtuplerJ   rZ   r[   s   @r9   r½   r½   /  se   ø„ õ-ð 48Ø).ñà—|‘|ðð —|‘|ðð ×)Ñ)¨DÑ0ð	ð
   $™;ðð 
ˆu|‰|Ñ	÷r:   r½   c                   óV   ‡ — e Zd Zˆ fd„Zdej
                  dej
                  fd„Zˆ xZS )ÚLiltIntermediatec                 ó  •— t         ‰|   «        t        j                  |j                  |j
                  «      | _        t        |j                  t        «      rt        |j                     | _        y |j                  | _        y r¬   )r!   r"   r   ri   r%   Úintermediate_sizer²   Ú
isinstanceÚ
hidden_actÚstrr	   Úintermediate_act_fnr5   s     €r9   r"   zLiltIntermediate.__init__O  s]   ø€ Ü‰ÑÔÜ—Y‘Y˜v×1Ñ1°6×3KÑ3KÓLˆŒ
Üf×'Ñ'¬Ô-Ü'-¨f×.?Ñ.?Ñ'@ˆDÕ$à'-×'8Ñ'8ˆDÕ$r:   r—   r´   c                 óJ   — | j                  |«      }| j                  |«      }|S r¬   )r²   rÑ   )r6   r—   s     r9   rJ   zLiltIntermediate.forwardW  s&   € ØŸ
™
 =Ó1ˆØ×0Ñ0°Ó?ˆØÐr:   r¹   r[   s   @r9   rË   rË   N  s#   ø„ ô9ð U§\¡\ð °e·l±l÷ r:   rË   c                   ón   ‡ — e Zd Zˆ fd„Zdej
                  dej
                  dej
                  fd„Zˆ xZS )Ú
LiltOutputc                 ó(  •— t         ‰|   «        t        j                  |j                  |j
                  «      | _        t        j                  |j
                  |j                  ¬«      | _        t        j                  |j                  «      | _        y r±   )r!   r"   r   ri   rÍ   r%   r²   r,   r-   r.   r/   r0   r5   s     €r9   r"   zLiltOutput.__init___  s`   ø€ Ü‰ÑÔÜ—Y‘Y˜v×7Ñ7¸×9KÑ9KÓLˆŒ
ÜŸ™ f×&8Ñ&8¸f×>SÑ>SÔTˆŒÜ—z‘z &×"<Ñ"<Ó=ˆr:   r—   r³   r´   c                 ór   — | j                  |«      }| j                  |«      }| j                  ||z   «      }|S r¬   r¶   r·   s      r9   rJ   zLiltOutput.forwarde  r¸   r:   r¹   r[   s   @r9   rÔ   rÔ   ^  r»   r:   rÔ   c                   ó°   ‡ — e Zd Zdˆ fd„	Z	 	 ddej
                  dej
                  dej                  dz  dedz  deej
                     f
d„Z	d	„ Z
d
„ Zˆ xZS )Ú	LiltLayerNc                 óº  •— t         ‰|   «        |j                  | _        d| _        t	        ||¬«      | _        t        |«      | _        t        |«      | _	        |j                  }|j                  }|j                  |j                  z  |_
        |j                  |j                  z  |_        t        |«      | _        t        |«      | _        ||_
        ||_        y )Nr   r¿   )r!   r"   Úchunk_size_feed_forwardÚseq_len_dimr½   Ú	attentionrË   ÚintermediaterÔ   rÀ   r%   rÍ   rg   Úlayout_intermediaterÁ   )r6   r7   r‡   rÂ   Úori_intermediate_sizer8   s        €r9   r"   zLiltLayer.__init__m  s¾   ø€ Ü‰ÑÔØ'-×'EÑ'EˆÔ$ØˆÔÜ& v¸ÔCˆŒÜ,¨VÓ4ˆÔÜ  Ó(ˆŒà ×,Ñ,ˆØ &× 8Ñ 8ÐØ#×/Ñ/°6×3NÑ3NÑNˆÔØ#)×#;Ñ#;¸v×?ZÑ?ZÑ#ZˆÔ Ü#3°FÓ#;ˆÔ Ü'¨Ó/ˆÔØ,ˆÔØ#8ˆÕ r:   r—   r˜   r™   rš   r´   c                 ó  — | j                  ||||¬«      }|d   }|d   }|dd  }t        | j                  | j                  | j                  |«      }	t        | j
                  | j                  | j                  |«      }
|	|
f|z   }|S )N)rš   r   r   rl   )rÜ   r   Úfeed_forward_chunkrÚ   rÛ   Úlayout_feed_forward_chunk)r6   r—   r˜   r™   rš   Úself_attention_outputsrÅ   rÆ   r«   Úlayer_outputÚlayout_layer_outputs              r9   rJ   zLiltLayer.forward~  s®   € ð "&§¡ØØØØ/ð	 "0ó "
Ðð 2°!Ñ4ÐØ"8¸Ñ";Ðà(¨¨Ð,ˆä0Ø×#Ñ# T×%AÑ%AÀ4×CSÑCSÐUeó
ˆô 8Ø×*Ñ*¨D×,HÑ,HÈ$×JZÑJZÐ\só
Ðð  Ð!4Ð5¸Ñ?ˆàˆr:   c                 óL   — | j                  |«      }| j                  ||«      }|S r¬   )rÝ   rÀ   ©r6   rÅ   Úintermediate_outputrä   s       r9   rá   zLiltLayer.feed_forward_chunk›  s,   € Ø"×/Ñ/Ð0@ÓAÐØ—{‘{Ð#6Ð8HÓIˆØÐr:   c                 óL   — | j                  |«      }| j                  ||«      }|S r¬   )rÞ   rÁ   rç   s       r9   râ   z#LiltLayer.layout_feed_forward_chunk   s.   € Ø"×6Ñ6Ð7GÓHÐØ×)Ñ)Ð*=Ð?OÓPˆØÐr:   r¬   r­   )rW   rX   rY   r"   r2   rº   rÇ   rÈ   rÉ   rJ   rá   râ   rZ   r[   s   @r9   rØ   rØ   l  so   ø„ õ9ð* 48Ø).ñà—|‘|ðð —|‘|ðð ×)Ñ)¨DÑ0ð	ð
   $™;ðð 
ˆu|‰|Ñ	óò:ö
r:   rØ   c                   óÀ   ‡ — e Zd Zˆ fd„Z	 	 	 	 ddej
                  dej
                  dej                  dz  dedz  dedz  dedz  d	eej
                     e	z  fd
„Z
ˆ xZS )ÚLiltEncoderc                 óÂ   •— t         ‰|   «        || _        t        j                  t        |j                  «      D cg c]  }t        |«      ‘Œ c}«      | _        y c c}w r¬   )	r!   r"   r7   r   Ú
ModuleListÚrangeÚnum_hidden_layersrØ   Úlayer)r6   r7   Ú_r8   s      €r9   r"   zLiltEncoder.__init__§  sC   ø€ Ü‰ÑÔØˆŒÜ—]‘]¼uÀV×E]ÑE]Ó?^Ö#_¸!¤I¨fÕ$5Ò#_Ó`ˆ
ùÒ#_s   ½ANr—   r˜   r™   rš   Úoutput_hidden_statesÚreturn_dictr´   c                 ó   — |rdnd }|rdnd }t        | j                  «      D ].  \  }	}
|r||fz   } |
||||«      }|d   }|d   }|sŒ&||d   fz   }Œ0 |r||fz   }|st        d„ |||fD «       «      S t        |||¬«      S )N© r   r   rl   c              3   ó$   K  — | ]  }||–— Œ
 y ­wr¬   rõ   )Ú.0Úvs     r9   ú	<genexpr>z&LiltEncoder.forward.<locals>.<genexpr>Í  s   è ø€ ò àð
 =ô ñùs   ‚)Úlast_hidden_stater—   Ú
attentions)Ú	enumeraterð   rÉ   r   )r6   r—   r˜   r™   rš   rò   ró   Úall_hidden_statesÚall_self_attentionsÚiÚlayer_moduleÚlayer_outputss               r9   rJ   zLiltEncoder.forward¬  sÞ   € ñ #7™B¸DÐÙ$5™b¸4Ðä(¨¯©Ó4ò 	P‰OˆAˆ|Ù#Ø$5¸Ð8HÑ$HÐ!á(ØØØØ!ó	ˆMð *¨!Ñ,ˆMØ)¨!Ñ,ˆMâ Ø&9¸]È1Ñ=MÐ<OÑ&OÑ#ð	Pñ"  Ø 1°]Ð4DÑ DÐáÜñ ð "Ø%Ø'ðôó ð ô Ø+Ø+Ø*ô
ð 	
r:   )NFFT)rW   rX   rY   r"   r2   rº   rÇ   rÈ   rÉ   r   rJ   rZ   r[   s   @r9   rë   rë   ¦  s   ø„ ôað 48Ø).Ø,1Ø#'ñ.
à—|‘|ð.
ð —|‘|ð.
ð ×)Ñ)¨DÑ0ð	.
ð
   $™;ð.
ð # T™kð.
ð ˜D‘[ð.
ð 
ˆu|‰|Ñ	˜Ñ	.÷.
r:   rë   c                   óV   ‡ — e Zd Zˆ fd„Zdej
                  dej
                  fd„Zˆ xZS )Ú
LiltPoolerc                 ó²   •— t         ‰|   «        t        j                  |j                  |j                  «      | _        t        j                  «       | _        y r¬   )r!   r"   r   ri   r%   r²   ÚTanhÚ
activationr5   s     €r9   r"   zLiltPooler.__init__ß  s9   ø€ Ü‰ÑÔÜ—Y‘Y˜v×1Ñ1°6×3EÑ3EÓFˆŒ
ÜŸ'™'›)ˆr:   r—   r´   c                 ó\   — |d d …df   }| j                  |«      }| j                  |«      }|S ©Nr   )r²   r  )r6   r—   Úfirst_token_tensorÚpooled_outputs       r9   rJ   zLiltPooler.forwardä  s6   € ð +ª1¨a¨4Ñ0ÐØŸ
™
Ð#5Ó6ˆØŸ™¨Ó6ˆØÐr:   r¹   r[   s   @r9   r  r  Þ  s#   ø„ ô$ð
 U§\¡\ð °e·l±l÷ r:   r  c                   ó6   ‡ — e Zd ZU eed<   dZdZg Zˆ fd„Zˆ xZ	S )ÚLiltPreTrainedModelr7   ÚliltTc                 óø   •— t         ‰|   |«       t        |t        «      rZt	        j
                  |j                  t        j                  |j                  j                  d   «      j                  d«      «       y y )Nr   r   )r!   Ú_init_weightsrÎ   r   ÚinitÚcopy_r   r2   r3   Úshaper4   )r6   Úmoduler8   s     €r9   r  z!LiltPreTrainedModel._init_weightsô  s[   ø€ Ü‰Ñ˜fÔ%ÜfÔ0Ô1ÜJ‰Jv×*Ñ*¬E¯L©L¸×9LÑ9L×9RÑ9RÐSUÑ9VÓ,W×,^Ñ,^Ð_fÓ,gÕhð 2r:   )
rW   rX   rY   r   Ú__annotations__Úbase_model_prefixÚsupports_gradient_checkpointingÚ_no_split_modulesr  rZ   r[   s   @r9   r  r  í  s'   ø… àÓØÐØ&*Ð#ØÐ÷ið ir:   r  c                   óH  ‡ — e Zd Zdˆ fd„	Zd„ Zd„ Ze	 	 	 	 	 	 	 	 	 ddej                  dz  dej                  dz  dej                  dz  dej                  dz  d	ej                  dz  d
ej                  dz  de	dz  de	dz  de	dz  de
ej                     ez  fd„«       Zˆ xZS )Ú	LiltModelc                 óÚ   •— t         ‰|   |«       || _        t        |«      | _        t        |«      | _        t        |«      | _        |rt        |«      nd| _
        | j                  «        y)zv
        add_pooling_layer (bool, *optional*, defaults to `True`):
            Whether to add a pooling layer
        N)r!   r"   r7   r   rI   r]   Úlayout_embeddingsrë   Úencoderr  ÚpoolerÚ	post_init)r6   r7   Úadd_pooling_layerr8   s      €r9   r"   zLiltModel.__init__ü  sZ   ø€ ô
 	‰Ñ˜Ô ØˆŒä,¨VÓ4ˆŒÜ!5°fÓ!=ˆÔÜ" 6Ó*ˆŒá,=”j Ô(À4ˆŒð 	‰Õr:   c                 ó.   — | j                   j                  S r¬   ©rI   r'   )r6   s    r9   Úget_input_embeddingszLiltModel.get_input_embeddings  s   € Ø‰×.Ñ.Ð.r:   c                 ó&   — || j                   _        y r¬   r!  )r6   r‚   s     r9   Úset_input_embeddingszLiltModel.set_input_embeddings  s   € Ø*/ˆ‰Õ'r:   NrE   ro   r™   rF   r   rG   rš   rò   ró   r´   c
                 óD  — ||n| j                   j                  }||n| j                   j                  }|	|	n| j                   j                  }	||t	        d«      ‚|#| j                  ||«       |j                  «       }n!||j                  «       dd }nt	        d«      ‚|\  }}||j                  n|j                  }|€)t        j                  |dz   t        j                  |¬«      }|€t        j                  ||f|¬«      }|€pt        | j                  d«      r4| j                  j                  dd…d|…f   }|j                  ||«      }|}n&t        j                  |t        j                  |¬«      }| j!                  ||«      }| j                  ||||¬	«      \  }}| j#                  ||¬
«      }| j%                  ||||||	¬«      }|d   }| j&                  | j'                  |«      nd}|	s
||f|dd z   S t)        |||j*                  |j,                  ¬«      S )aÅ  
        bbox (`torch.LongTensor` of shape `(batch_size, sequence_length, 4)`, *optional*):
            Bounding boxes of each input sequence tokens. Selected in the range `[0,
            config.max_2d_position_embeddings-1]`. Each bounding box should be a normalized version in (x0, y0, x1, y1)
            format, where (x0, y0) corresponds to the position of the upper left corner in the bounding box, and (x1,
            y1) represents the position of the lower right corner. See [Overview](#Overview) for normalization.

        Examples:

        ```python
        >>> from transformers import AutoTokenizer, AutoModel
        >>> from datasets import load_dataset

        >>> tokenizer = AutoTokenizer.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")
        >>> model = AutoModel.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")

        >>> dataset = load_dataset("nielsr/funsd-layoutlmv3", split="train")
        >>> example = dataset[0]
        >>> words = example["tokens"]
        >>> boxes = example["bboxes"]

        >>> encoding = tokenizer(words, boxes=boxes, return_tensors="pt")

        >>> outputs = model(**encoding)
        >>> last_hidden_states = outputs.last_hidden_state
        ```NzDYou cannot specify both input_ids and inputs_embeds at the same timer   z5You have to specify either input_ids or inputs_embeds)é   r<   )r>   rF   )rE   r   rF   rG   )ro   r   )r™   rš   rò   ró   r   r   )rú   Úpooler_outputr—   rû   )r7   rš   rò   Úuse_return_dictr}   Ú%warn_if_padding_and_no_attention_maskrB   r>   r2   rC   rD   Úonesr|   rI   rF   r4   Úget_extended_attention_maskr  r  r  r   r—   rû   )r6   rE   ro   r™   rF   r   rG   rš   rò   ró   ÚkwargsrH   Ú
batch_sizeÚ
seq_lengthr>   Úbuffered_token_type_idsÚ buffered_token_type_ids_expandedÚextended_attention_maskÚembedding_outputÚlayout_embedding_outputÚencoder_outputsÚsequence_outputr
  s                          r9   rJ   zLiltModel.forward  sR  € ðP 2CÐ1NÑ-ÐTX×T_ÑT_×TqÑTqÐà$8Ð$DÑ È$Ï+É+×JjÑJjð 	ð &1Ð%<‘kÀ$Ç+Á+×B]ÑB]ˆàÐ  ]Ð%>ÜÐcÓdÐdØÐ"Ø×6Ñ6°yÀ.ÔQØ#Ÿ.™.Ó*‰KØÐ&Ø'×,Ñ,Ó.¨s°Ð3‰KäÐTÓUÐUà!,Ñˆ
JØ%.Ð%:×!Ò!À×@TÑ@Tˆàˆ<Ü—;‘;˜{¨TÑ1¼¿¹ÈFÔSˆDàÐ!Ü"ŸZ™Z¨*°jÐ)AÈ6ÔRˆNàÐ!Üt—‘Ð(8Ô9Ø*.¯/©/×*HÑ*HÊÈKÈZÈKÈÑ*XÐ'Ø3J×3QÑ3QÐR\Ð^hÓ3iÐ0Ø!A‘ä!&§¡¨[ÄÇ
Á
ÐSYÔ!Zð 15×0PÑ0PÐQ_ÐalÓ0mÐà)-¯©ØØ%Ø)Ø'ð	 *9ó *
Ñ&Ð˜,ð #'×"8Ñ"8¸dÐQ]Ð"8Ó"^ÐàŸ,™,ØØ#Ø2Ø/Ø!5Ø#ð 'ó 
ˆð *¨!Ñ,ˆØ8<¿¹Ð8O˜Ÿ™ OÔ4ÐUYˆáØ# ]Ð3°oÀaÀbÐ6IÑIÐIä)Ø-Ø'Ø)×7Ñ7Ø&×1Ñ1ô	
ð 	
r:   )T)	NNNNNNNNN)rW   rX   rY   r"   r"  r$  r   r2   rº   rÈ   rÉ   r   rJ   rZ   r[   s   @r9   r  r  ú  s  ø„ õò"/ò0ð ð *.Ø$(Ø.2Ø.2Ø,0Ø-1Ø)-Ø,0Ø#'ñh
à—<‘< $Ñ&ðh
ð l‰l˜TÑ!ðh
ð Ÿ™ tÑ+ð	h
ð
 Ÿ™ tÑ+ðh
ð —l‘l TÑ)ðh
ð —|‘| dÑ*ðh
ð   $™;ðh
ð # T™kðh
ð ˜D‘[ðh
ð 
ˆu|‰|Ñ	Ð9Ñ	9òh
ó ôh
r:   r  zœ
    LiLT Model transformer with a sequence classification/regression head on top (a linear layer on top of the pooled
    output) e.g. for GLUE tasks.
    )Úcustom_introc                   óZ  ‡ — e Zd Zˆ fd„Ze	 	 	 	 	 	 	 	 	 	 ddej                  dz  dej                  dz  dej                  dz  dej                  dz  dej                  dz  dej                  dz  d	ej                  dz  d
e	dz  de	dz  de	dz  de
ej                     ez  fd„«       Zˆ xZS )ÚLiltForSequenceClassificationc                 ó¸   •— t         ‰|   |«       |j                  | _        || _        t	        |d¬«      | _        t        |«      | _        | j                  «        y ©NF)r  )	r!   r"   Ú
num_labelsr7   r  r  ÚLiltClassificationHeadÚ
classifierr  r5   s     €r9   r"   z&LiltForSequenceClassification.__init__‡  sJ   ø€ Ü‰Ñ˜Ô Ø ×+Ñ+ˆŒØˆŒä˜f¸Ô>ˆŒ	Ü0°Ó8ˆŒð 	‰Õr:   NrE   ro   r™   rF   r   rG   Úlabelsrš   rò   ró   r´   c                 óT  — |
|
n| j                   j                  }
| j                  ||||||||	|
¬«	      }|d   }| j                  |«      }d}|¢|j	                  |j
                  «      }| j                   j                  €| j                  dk(  rd| j                   _        nl| j                  dkD  rL|j                  t        j                  k(  s|j                  t        j                  k(  rd| j                   _        nd| j                   _        | j                   j                  dk(  rIt        «       }| j                  dk(  r& ||j                  «       |j                  «       «      }nŒ |||«      }n‚| j                   j                  dk(  r=t        «       } ||j                  d| j                  «      |j                  d«      «      }n,| j                   j                  dk(  rt!        «       } |||«      }|
s|f|d	d z   }||f|z   S |S t#        |||j$                  |j&                  ¬
«      S )aÌ  
        bbox (`torch.LongTensor` of shape `(batch_size, sequence_length, 4)`, *optional*):
            Bounding boxes of each input sequence tokens. Selected in the range `[0,
            config.max_2d_position_embeddings-1]`. Each bounding box should be a normalized version in (x0, y0, x1, y1)
            format, where (x0, y0) corresponds to the position of the upper left corner in the bounding box, and (x1,
            y1) represents the position of the lower right corner. See [Overview](#Overview) for normalization.
        labels (`torch.LongTensor` of shape `(batch_size,)`, *optional*):
            Labels for computing the sequence classification/regression loss. Indices should be in `[0, ...,
            config.num_labels - 1]`. If `config.num_labels == 1` a regression loss is computed (Mean-Square loss), If
            `config.num_labels > 1` a classification loss is computed (Cross-Entropy).

        Examples:

        ```python
        >>> from transformers import AutoTokenizer, AutoModelForSequenceClassification
        >>> from datasets import load_dataset

        >>> tokenizer = AutoTokenizer.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")
        >>> model = AutoModelForSequenceClassification.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")

        >>> dataset = load_dataset("nielsr/funsd-layoutlmv3", split="train")
        >>> example = dataset[0]
        >>> words = example["tokens"]
        >>> boxes = example["bboxes"]

        >>> encoding = tokenizer(words, boxes=boxes, return_tensors="pt")

        >>> outputs = model(**encoding)
        >>> predicted_class_idx = outputs.logits.argmax(-1).item()
        >>> predicted_class = model.config.id2label[predicted_class_idx]
        ```N©ro   r™   rF   r   rG   rš   rò   ró   r   r   Ú
regressionÚsingle_label_classificationÚmulti_label_classificationr   rl   ©ÚlossÚlogitsr—   rû   )r7   r(  r  r=  r@   r>   Úproblem_typer;  r=   r2   rD   rO   r   Úsqueezer   r‰   r   r   r—   rû   ©r6   rE   ro   r™   rF   r   rG   r>  rš   rò   ró   r,  r«   r5  rF  rE  Úloss_fctrÀ   s                     r9   rJ   z%LiltForSequenceClassification.forward’  sí  € ð\ &1Ð%<‘kÀ$Ç+Á+×B]ÑB]ˆà—)‘)ØØØ)Ø)Ø%Ø'Ø/Ø!5Ø#ð ó 

ˆð " !™*ˆØ—‘ Ó1ˆàˆØÑà—Y‘Y˜vŸ}™}Ó-ˆFØ{‰{×'Ñ'Ð/Ø—?‘? aÒ'Ø/;D—K‘KÕ,Ø—_‘_ qÒ(¨f¯l©l¼e¿j¹jÒ.HÈFÏLÉLÔ\a×\eÑ\eÒLeØ/LD—K‘KÕ,à/KD—K‘KÔ,à{‰{×'Ñ'¨<Ò7Ü"›9Ø—?‘? aÒ'Ù# F§N¡NÓ$4°f·n±nÓ6FÓG‘Dá# F¨FÓ3‘DØ—‘×)Ñ)Ð-JÒJÜ+Ó-Ù §¡¨B°·±Ó @À&Ç+Á+ÈbÃ/ÓR‘Ø—‘×)Ñ)Ð-IÒIÜ,Ó.Ù ¨Ó/áØY ¨¨ Ñ,ˆFØ)-Ð)9TG˜fÑ$ÐE¸vÐEä'ØØØ!×/Ñ/Ø×)Ñ)ô	
ð 	
r:   ©
NNNNNNNNNN)rW   rX   rY   r"   r   r2   Ú
LongTensorrº   rÇ   rÈ   rÉ   r   rJ   rZ   r[   s   @r9   r8  r8    s  ø„ ô	ð ð .2Ø$(Ø37Ø26Ø04Ø26Ø*.Ø)-Ø,0Ø#'ñ_
à×#Ñ# dÑ*ð_
ð l‰l˜TÑ!ð_
ð ×)Ñ)¨DÑ0ð	_
ð
 ×(Ñ(¨4Ñ/ð_
ð ×&Ñ&¨Ñ-ð_
ð ×(Ñ(¨4Ñ/ð_
ð × Ñ  4Ñ'ð_
ð   $™;ð_
ð # T™kð_
ð ˜D‘[ð_
ð 
ˆu|‰|Ñ	Ð7Ñ	7ò_
ó ô_
r:   r8  c                   óZ  ‡ — e Zd Zˆ fd„Ze	 	 	 	 	 	 	 	 	 	 ddej                  dz  dej                  dz  dej                  dz  dej                  dz  dej                  dz  dej                  dz  d	ej                  dz  d
edz  dedz  dedz  de	ej                     ez  fd„«       Zˆ xZS )ÚLiltForTokenClassificationc                 ód  •— t         ‰|   |«       |j                  | _        t        |d¬«      | _        |j
                  |j
                  n|j                  }t        j                  |«      | _	        t        j                  |j                  |j                  «      | _        | j                  «        y r:  )r!   r"   r;  r  r  Úclassifier_dropoutr/   r   r.   r0   ri   r%   r=  r  ©r6   r7   rP  r8   s      €r9   r"   z#LiltForTokenClassification.__init__ø  sŠ   ø€ Ü‰Ñ˜Ô Ø ×+Ñ+ˆŒä˜f¸Ô>ˆŒ	à)/×)BÑ)BÐ)NˆF×%Ò%ÐTZ×TnÑTnð 	ô —z‘zÐ"4Ó5ˆŒÜŸ)™) F×$6Ñ$6¸×8IÑ8IÓJˆŒð 	‰Õr:   NrE   ro   r™   rF   r   rG   r>  rš   rò   ró   r´   c                 óÞ  — |
|
n| j                   j                  }
| j                  ||||||||	|
¬«	      }|d   }| j                  |«      }| j	                  |«      }d}|W|j                  |j                  «      }t        «       } ||j                  d| j                  «      |j                  d«      «      }|
s|f|dd z   }||f|z   S |S t        |||j                  |j                  ¬«      S )aÈ  
        bbox (`torch.LongTensor` of shape `(batch_size, sequence_length, 4)`, *optional*):
            Bounding boxes of each input sequence tokens. Selected in the range `[0,
            config.max_2d_position_embeddings-1]`. Each bounding box should be a normalized version in (x0, y0, x1, y1)
            format, where (x0, y0) corresponds to the position of the upper left corner in the bounding box, and (x1,
            y1) represents the position of the lower right corner. See [Overview](#Overview) for normalization.
        labels (`torch.LongTensor` of shape `(batch_size, sequence_length)`, *optional*):
            Labels for computing the token classification loss. Indices should be in `[0, ..., config.num_labels - 1]`.

        Examples:

        ```python
        >>> from transformers import AutoTokenizer, AutoModelForTokenClassification
        >>> from datasets import load_dataset

        >>> tokenizer = AutoTokenizer.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")
        >>> model = AutoModelForTokenClassification.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")

        >>> dataset = load_dataset("nielsr/funsd-layoutlmv3", split="train")
        >>> example = dataset[0]
        >>> words = example["tokens"]
        >>> boxes = example["bboxes"]

        >>> encoding = tokenizer(words, boxes=boxes, return_tensors="pt")

        >>> outputs = model(**encoding)
        >>> predicted_class_indices = outputs.logits.argmax(-1)
        ```Nr@  r   r   rl   rD  )r7   r(  r  r0   r=  r@   r>   r   r‰   r;  r   r—   rû   rI  s                     r9   rJ   z"LiltForTokenClassification.forward  s	  € ðV &1Ð%<‘kÀ$Ç+Á+×B]ÑB]ˆà—)‘)ØØØ)Ø)Ø%Ø'Ø/Ø!5Ø#ð ó 

ˆð " !™*ˆàŸ,™, Ó7ˆØ—‘ Ó1ˆàˆØÐà—Y‘Y˜vŸ}™}Ó-ˆFÜ'Ó)ˆHÙ˜FŸK™K¨¨D¯O©OÓ<¸f¿k¹kÈ"»oÓNˆDáØY ¨¨ Ñ,ˆFØ)-Ð)9TG˜fÑ$ÐE¸vÐEä$ØØØ!×/Ñ/Ø×)Ñ)ô	
ð 	
r:   rK  )rW   rX   rY   r"   r   r2   rL  rÇ   rÈ   rÉ   rº   r   rJ   rZ   r[   s   @r9   rN  rN  õ  s  ø„ ôð ð .2Ø(,Ø37Ø26Ø04Ø26Ø*.Ø)-Ø,0Ø#'ñM
à×#Ñ# dÑ*ðM
ð ×Ñ Ñ%ðM
ð ×)Ñ)¨DÑ0ð	M
ð
 ×(Ñ(¨4Ñ/ðM
ð ×&Ñ&¨Ñ-ðM
ð ×(Ñ(¨4Ñ/ðM
ð × Ñ  4Ñ'ðM
ð   $™;ðM
ð # T™kðM
ð ˜D‘[ðM
ð 
ˆu|‰|Ñ	Ð4Ñ	4òM
ó ôM
r:   rN  c                   ó(   ‡ — e Zd ZdZˆ fd„Zd„ Zˆ xZS )r<  z-Head for sentence-level classification tasks.c                 óZ  •— t         ‰|   «        t        j                  |j                  |j                  «      | _        |j                  |j                  n|j                  }t        j                  |«      | _	        t        j                  |j                  |j                  «      | _        y r¬   )r!   r"   r   ri   r%   r²   rP  r/   r.   r0   r;  Úout_projrQ  s      €r9   r"   zLiltClassificationHead.__init__[  s   ø€ Ü‰ÑÔÜ—Y‘Y˜v×1Ñ1°6×3EÑ3EÓFˆŒ
à)/×)BÑ)BÐ)NˆF×%Ò%ÐTZ×TnÑTnð 	ô —z‘zÐ"4Ó5ˆŒÜŸ	™	 &×"4Ñ"4°f×6GÑ6GÓHˆr:   c                 óÐ   — |d d …dd d …f   }| j                  |«      }| j                  |«      }t        j                  |«      }| j                  |«      }| j	                  |«      }|S r  )r0   r²   r2   ÚtanhrU  )r6   Úfeaturesr,  r‹   s       r9   rJ   zLiltClassificationHead.forwardd  sY   € Ø’Q˜š1WÑˆØL‰L˜‹OˆØJ‰Jq‹MˆÜJ‰Jq‹MˆØL‰L˜‹OˆØM‰M˜!ÓˆØˆr:   )rW   rX   rY   Ú__doc__r"   rJ   rZ   r[   s   @r9   r<  r<  X  s   ø„ Ù7ôIör:   r<  c                   óz  ‡ — e Zd Zˆ fd„Ze	 	 	 	 	 	 	 	 	 	 	 ddej                  dz  dej                  dz  dej                  dz  dej                  dz  dej                  dz  dej                  dz  d	ej                  dz  d
ej                  dz  dedz  dedz  dedz  de	ej                     ez  fd„«       Zˆ xZS )ÚLiltForQuestionAnsweringc                 óè   •— t         ‰|   |«       |j                  | _        t        |d¬«      | _        t        j                  |j                  |j                  «      | _        | j                  «        y r:  )
r!   r"   r;  r  r  r   ri   r%   Ú
qa_outputsr  r5   s     €r9   r"   z!LiltForQuestionAnswering.__init__q  sU   ø€ Ü‰Ñ˜Ô Ø ×+Ñ+ˆŒä˜f¸Ô>ˆŒ	ÜŸ)™) F×$6Ñ$6¸×8IÑ8IÓJˆŒð 	‰Õr:   NrE   ro   r™   rF   r   rG   Ústart_positionsÚend_positionsrš   rò   ró   r´   c                 ó(  — ||n| j                   j                  }| j                  |||||||	|
|¬«	      }|d   }| j                  |«      }|j	                  dd¬«      \  }}|j                  d«      j                  «       }|j                  d«      j                  «       }d}|·|µt        |j                  «       «      dkD  r|j                  d«      }t        |j                  «       «      dkD  r|j                  d«      }|j                  d«      }|j                  d|«      }|j                  d|«      }t        |¬«      } |||«      } |||«      }||z   dz  }|s||f|dd z   }||f|z   S |S t        ||||j                  |j                  ¬	«      S )
aÚ  
        bbox (`torch.LongTensor` of shape `(batch_size, sequence_length, 4)`, *optional*):
            Bounding boxes of each input sequence tokens. Selected in the range `[0,
            config.max_2d_position_embeddings-1]`. Each bounding box should be a normalized version in (x0, y0, x1, y1)
            format, where (x0, y0) corresponds to the position of the upper left corner in the bounding box, and (x1,
            y1) represents the position of the lower right corner. See [Overview](#Overview) for normalization.

        Examples:

        ```python
        >>> from transformers import AutoTokenizer, AutoModelForQuestionAnswering
        >>> from datasets import load_dataset

        >>> tokenizer = AutoTokenizer.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")
        >>> model = AutoModelForQuestionAnswering.from_pretrained("SCUT-DLVCLab/lilt-roberta-en-base")

        >>> dataset = load_dataset("nielsr/funsd-layoutlmv3", split="train")
        >>> example = dataset[0]
        >>> words = example["tokens"]
        >>> boxes = example["bboxes"]

        >>> encoding = tokenizer(words, boxes=boxes, return_tensors="pt")

        >>> outputs = model(**encoding)

        >>> answer_start_index = outputs.start_logits.argmax()
        >>> answer_end_index = outputs.end_logits.argmax()

        >>> predict_answer_tokens = encoding.input_ids[0, answer_start_index : answer_end_index + 1]
        >>> predicted_answer = tokenizer.decode(predict_answer_tokens)
        ```Nr@  r   r   r   rL   )Úignore_indexrl   )rE  Ústart_logitsÚ
end_logitsr—   rû   )r7   r(  r  r]  ÚsplitrH  r–   ÚlenrB   Úclampr   r   r—   rû   )r6   rE   ro   r™   rF   r   rG   r^  r_  rš   rò   ró   r,  r«   r5  rF  rb  rc  Ú
total_lossÚignored_indexrJ  Ú
start_lossÚend_lossrÀ   s                           r9   rJ   z LiltForQuestionAnswering.forward{  sÃ  € ð^ &1Ð%<‘kÀ$Ç+Á+×B]ÑB]ˆà—)‘)ØØØ)Ø)Ø%Ø'Ø/Ø!5Ø#ð ó 

ˆð " !™*ˆà—‘ Ó1ˆØ#)§<¡<°°r <Ó#:Ñ ˆjØ#×+Ñ+¨BÓ/×:Ñ:Ó<ˆØ×'Ñ'¨Ó+×6Ñ6Ó8ˆ
àˆ
ØÐ&¨=Ð+Dä?×'Ñ'Ó)Ó*¨QÒ.Ø"1×"9Ñ"9¸"Ó"=Ü=×%Ñ%Ó'Ó(¨1Ò,Ø -× 5Ñ 5°bÓ 9à(×-Ñ-¨aÓ0ˆMØ-×3Ñ3°A°}ÓEˆOØ)×/Ñ/°°=ÓAˆMä'°]ÔCˆHÙ! ,°Ó@ˆJÙ 
¨MÓ:ˆHØ$ xÑ/°1Ñ4ˆJáØ" JÐ/°'¸!¸"°+Ñ=ˆFØ/9Ð/EZM FÑ*ÐQÈ6ÐQä+ØØ%Ø!Ø!×/Ñ/Ø×)Ñ)ô
ð 	
r:   )NNNNNNNNNNN)rW   rX   rY   r"   r   r2   rL  rÇ   rÈ   rÉ   rº   r   rJ   rZ   r[   s   @r9   r[  r[  n  s6  ø„ ôð ð .2Ø(,Ø37Ø26Ø04Ø26Ø37Ø15Ø)-Ø,0Ø#'ñ^
à×#Ñ# dÑ*ð^
ð ×Ñ Ñ%ð^
ð ×)Ñ)¨DÑ0ð	^
ð
 ×(Ñ(¨4Ñ/ð^
ð ×&Ñ&¨Ñ-ð^
ð ×(Ñ(¨4Ñ/ð^
ð ×)Ñ)¨DÑ0ð^
ð ×'Ñ'¨$Ñ.ð^
ð   $™;ð^
ð # T™kð^
ð ˜D‘[ð^
ð 
ˆu|‰|Ñ	Ð;Ñ	;ò^
ó ô^
r:   r[  )r[  r8  rN  r  r  )3rY  r“   r2   r   Útorch.nnr   r   r   Ú r   r  Úactivationsr	   Úmodeling_layersr
   Úmodeling_outputsr   r   r   r   r   Úmodeling_utilsr   Úpytorch_utilsr   Úutilsr   r   Úconfiguration_liltr   Ú
get_loggerrW   ÚloggerÚModuler   r]   rw   r¯   r½   rË   rÔ   rØ   rë   r  r  r  r8  rN  r<  r[  Ú__all__rõ   r:   r9   ú<module>rx     s³  ðñ ã ã Ý ß AÑ Aå &Ý !Ý 9÷õ õ .Ý 6ß ,Ý *ð 
ˆ×	Ñ	˜HÓ	%€ôS=˜Ÿ™ô S=ôl5+˜2Ÿ9™9ô 5+ôpf˜Ÿ	™	ô fôTR—Y‘Yô ôB—I‘Iô ô>r—y‘yô ô —‘ô ô7Ð*ô 7ôt4
"—)‘)ô 4
ôp—‘ô ð ô	i˜/ó 	ió ð	ið ôA
Ð#ó A
ó ðA
ñH ðôôm
Ð$7ó m
óðm
ð` ô^
Ð!4ó ^
ó ð^
ôD˜RŸY™Yô ð, ôk
Ð2ó k
ó ðk
ò\r:   