Lines Matching refs:inp
92 $inp="%rdi"; # 1st arg
103 @inp=map("%xmm$_",(6..9));
173 lea $inp_elm_size*2($inp),$inp
184 mov `$inp_elm_size*$i+2*$ptr_size-$inp_elm_size*2`($inp),$one
185 mov `$inp_elm_size*$i+0-$inp_elm_size*2`($inp),$inptr_reg
187 mov `$inp_elm_size*$i+$ptr_size-$inp_elm_size*2`($inp),$outptr_reg
191 movdqu `$inp_elm_size*$i+2*$ptr_size+8-$inp_elm_size*2`($inp),@out[$i]
206 movdqu (@inptr[0]),@inp[0] # load inputs
208 movdqu (@inptr[1]),@inp[1]
209 pxor @inp[0],@out[0]
210 movdqu (@inptr[2]),@inp[2]
211 pxor @inp[1],@out[1]
212 movdqu (@inptr[3]),@inp[3]
213 pxor @inp[2],@out[2]
214 pxor @inp[3],@out[3]
315 movdqu (@inptr[0],$offset),@inp[0]
319 movdqu (@inptr[1],$offset),@inp[1]
320 pxor $zero,@inp[0]
322 movdqu (@inptr[2],$offset),@inp[2]
323 pxor $zero,@inp[1]
325 movdqu (@inptr[3],$offset),@inp[3]
326 pxor $zero,@inp[2]
329 pxor $zero,@inp[3]
332 pxor @inp[0],@out[0]
334 pxor @inp[1],@out[1]
336 pxor @inp[2],@out[2]
338 pxor @inp[3],@out[3]
347 #pxor @inp[0],@out[0]
348 #pxor @inp[1],@out[1]
350 #movdqu @out[0],`$inp_elm_size*0+2*$ptr_size+8-$inp_elm_size*2`($inp)
351 #pxor @inp[2],@out[2]
352 #movdqu @out[1],`$inp_elm_size*1+2*$ptr_size+8-$inp_elm_size*2`($inp)
353 #pxor @inp[3],@out[3]
354 #movdqu @out[2],`$inp_elm_size*2+2*$ptr_size+8-$inp_elm_size*2`($inp) # won't fix, let caller
355 #movdqu @out[3],`$inp_elm_size*3+2*$ptr_size+8-$inp_elm_size*2`($inp) # figure this out...
357 lea `$inp_elm_size*4`($inp),$inp
455 lea $inp_elm_size*2($inp),$inp
466 mov `$inp_elm_size*$i+2*$ptr_size-$inp_elm_size*2`($inp),$one
467 mov `$inp_elm_size*$i+0-$inp_elm_size*2`($inp),$inptr_reg
469 mov `$inp_elm_size*$i+$ptr_size-$inp_elm_size*2`($inp),$outptr_reg
473 movdqu `$inp_elm_size*$i+2*$ptr_size+8-$inp_elm_size*2`($inp),@inp[$i]
592 pxor $rndkey0,@inp[0]
593 pxor $rndkey0,@inp[1]
596 pxor $rndkey0,@inp[2]
597 pxor $rndkey0,@inp[3]
600 aesdeclast @inp[0],@out[0]
601 aesdeclast @inp[1],@out[1]
602 movdqu -16(@inptr[0],$offset),@inp[0] # load next IV
603 movdqu -16(@inptr[1],$offset),@inp[1]
604 aesdeclast @inp[2],@out[2]
605 aesdeclast @inp[3],@out[3]
606 movdqu -16(@inptr[2],$offset),@inp[2]
607 movdqu -16(@inptr[3],$offset),@inp[3]
629 lea `$inp_elm_size*4`($inp),$inp
673 my @inp=map("%xmm$_",(10..13));
717 # +128 off-load area for @inp[0..3]
728 lea `$inp_elm_size*4`($inp),$inp
741 mov `$inp_elm_size*$i+2*$ptr_size-$inp_elm_size*4`($inp),$one
743 mov `$inp_elm_size*$i+0-$inp_elm_size*4`($inp),$ptr_reg
746 mov `$inp_elm_size*$i+$ptr_size-$inp_elm_size*4`($inp),$temp_reg
750 vmovdqu `$inp_elm_size*$i+2*$ptr_size+8-$inp_elm_size*4`($inp),@out[$i]
765 vpxor (@ptr[0]),$zero,@inp[0] # load inputs and xor with 0-round
767 vpxor (@ptr[1]),$zero,@inp[1]
768 vpxor (@ptr[2]),$zero,@inp[2]
769 vpxor (@ptr[3]),$zero,@inp[3]
770 vpxor @inp[0],@out[0],@out[0]
771 vpxor (@ptr[4]),$zero,@inp[0]
772 vpxor @inp[1],@out[1],@out[1]
773 vpxor (@ptr[5]),$zero,@inp[1]
774 vpxor @inp[2],@out[2],@out[2]
775 vpxor (@ptr[6]),$zero,@inp[2]
776 vpxor @inp[3],@out[3],@out[3]
777 vpxor (@ptr[7]),$zero,@inp[3]
778 vpxor @inp[0],@out[4],@out[4]
780 vpxor @inp[1],@out[5],@out[5]
781 vpxor @inp[2],@out[6],@out[6]
782 vpxor @inp[3],@out[7],@out[7]
814 vpxor 16(@ptr[$i]),$zero,@inp[$i%4] # load input and xor with 0-round
821 vmovdqu @inp[$i%4],`16*$i`($offload) # off-load
918 vpxor @inp[0],@out[4],@out[4]
921 vpxor @inp[1],@out[5],@out[5]
924 vpxor @inp[2],@out[6],@out[6]
927 vpxor @inp[3],@out[7],@out[7]
935 #lea `$inp_elm_size*8`($inp),$inp
1014 # +128 off-load area for @inp[0..3]
1027 lea `$inp_elm_size*4`($inp),$inp
1040 mov `$inp_elm_size*$i+2*$ptr_size-$inp_elm_size*4`($inp),$one
1042 mov `$inp_elm_size*$i+0-$inp_elm_size*4`($inp),$ptr_reg
1045 mov `$inp_elm_size*$i+$ptr_size-$inp_elm_size*4`($inp),$temp_reg
1049 vmovdqu `$inp_elm_size*$i+2*$ptr_size+8-$inp_elm_size*4`($inp),@out[$i]
1123 vmovdqu 16(@ptr[$i]),@inp[$i%4] # load input
1130 vmovdqu @inp[$i%4],`128+16*$i`(%rsp) # off-load
1243 vmovdqu @inp[0],0x40($offload)
1244 vpxor @inp[0],$zero,@out[4]
1247 vmovdqu @inp[1],0x50($offload)
1248 vpxor @inp[1],$zero,@out[5]
1251 vmovdqu @inp[2],0x60($offload)
1252 vpxor @inp[2],$zero,@out[6]
1255 vmovdqu @inp[3],0x70($offload)
1256 vpxor @inp[3],$zero,@out[7]
1265 #lea `$inp_elm_size*8`($inp),$inp