Merge branch 'drm-patches' of master.kernel.org:/pub/scm/linux/kernel/git/airlied...
[linux-drm-fsl-dcu.git] / arch / powerpc / mm / hash_low_64.S
1 /*
2  * ppc64 MMU hashtable management routines
3  *
4  * (c) Copyright IBM Corp. 2003, 2005
5  *
6  * Maintained by: Benjamin Herrenschmidt
7  *                <benh@kernel.crashing.org>
8  *
9  * This file is covered by the GNU Public Licence v2 as
10  * described in the kernel's COPYING file.
11  */
12
13 #include <asm/reg.h>
14 #include <asm/pgtable.h>
15 #include <asm/mmu.h>
16 #include <asm/page.h>
17 #include <asm/types.h>
18 #include <asm/ppc_asm.h>
19 #include <asm/asm-offsets.h>
20 #include <asm/cputable.h>
21
22         .text
23
24 /*
25  * Stackframe:
26  *              
27  *         +-> Back chain                       (SP + 256)
28  *         |   General register save area       (SP + 112)
29  *         |   Parameter save area              (SP + 48)
30  *         |   TOC save area                    (SP + 40)
31  *         |   link editor doubleword           (SP + 32)
32  *         |   compiler doubleword              (SP + 24)
33  *         |   LR save area                     (SP + 16)
34  *         |   CR save area                     (SP + 8)
35  * SP ---> +-- Back chain                       (SP + 0)
36  */
37 #define STACKFRAMESIZE  256
38
39 /* Save parameters offsets */
40 #define STK_PARM(i)     (STACKFRAMESIZE + 48 + ((i)-3)*8)
41
42 /* Save non-volatile offsets */
43 #define STK_REG(i)      (112 + ((i)-14)*8)
44
45
46 #ifndef CONFIG_PPC_64K_PAGES
47
48 /*****************************************************************************
49  *                                                                           *
50  *           4K SW & 4K HW pages implementation                              *
51  *                                                                           *
52  *****************************************************************************/
53
54
55 /*
56  * _hash_page_4K(unsigned long ea, unsigned long access, unsigned long vsid,
57  *               pte_t *ptep, unsigned long trap, int local)
58  *
59  * Adds a 4K page to the hash table in a segment of 4K pages only
60  */
61
62 _GLOBAL(__hash_page_4K)
63         mflr    r0
64         std     r0,16(r1)
65         stdu    r1,-STACKFRAMESIZE(r1)
66         /* Save all params that we need after a function call */
67         std     r6,STK_PARM(r6)(r1)
68         std     r8,STK_PARM(r8)(r1)
69         
70         /* Add _PAGE_PRESENT to access */
71         ori     r4,r4,_PAGE_PRESENT
72
73         /* Save non-volatile registers.
74          * r31 will hold "old PTE"
75          * r30 is "new PTE"
76          * r29 is "va"
77          * r28 is a hash value
78          * r27 is hashtab mask (maybe dynamic patched instead ?)
79          */
80         std     r27,STK_REG(r27)(r1)
81         std     r28,STK_REG(r28)(r1)
82         std     r29,STK_REG(r29)(r1)
83         std     r30,STK_REG(r30)(r1)
84         std     r31,STK_REG(r31)(r1)
85         
86         /* Step 1:
87          *
88          * Check permissions, atomically mark the linux PTE busy
89          * and hashed.
90          */ 
91 1:
92         ldarx   r31,0,r6
93         /* Check access rights (access & ~(pte_val(*ptep))) */
94         andc.   r0,r4,r31
95         bne-    htab_wrong_access
96         /* Check if PTE is busy */
97         andi.   r0,r31,_PAGE_BUSY
98         /* If so, just bail out and refault if needed. Someone else
99          * is changing this PTE anyway and might hash it.
100          */
101         bne-    htab_bail_ok
102
103         /* Prepare new PTE value (turn access RW into DIRTY, then
104          * add BUSY,HASHPTE and ACCESSED)
105          */
106         rlwinm  r30,r4,32-9+7,31-7,31-7 /* _PAGE_RW -> _PAGE_DIRTY */
107         or      r30,r30,r31
108         ori     r30,r30,_PAGE_BUSY | _PAGE_ACCESSED | _PAGE_HASHPTE
109         /* Write the linux PTE atomically (setting busy) */
110         stdcx.  r30,0,r6
111         bne-    1b
112         isync
113
114         /* Step 2:
115          *
116          * Insert/Update the HPTE in the hash table. At this point,
117          * r4 (access) is re-useable, we use it for the new HPTE flags
118          */
119
120         /* Calc va and put it in r29 */
121         rldicr  r29,r5,28,63-28
122         rldicl  r3,r3,0,36
123         or      r29,r3,r29
124
125         /* Calculate hash value for primary slot and store it in r28 */
126         rldicl  r5,r5,0,25              /* vsid & 0x0000007fffffffff */
127         rldicl  r0,r3,64-12,48          /* (ea >> 12) & 0xffff */
128         xor     r28,r5,r0
129
130         /* Convert linux PTE bits into HW equivalents */
131         andi.   r3,r30,0x1fe            /* Get basic set of flags */
132         xori    r3,r3,HPTE_R_N          /* _PAGE_EXEC -> NOEXEC */
133         rlwinm  r0,r30,32-9+1,30,30     /* _PAGE_RW -> _PAGE_USER (r0) */
134         rlwinm  r4,r30,32-7+1,30,30     /* _PAGE_DIRTY -> _PAGE_USER (r4) */
135         and     r0,r0,r4                /* _PAGE_RW & _PAGE_DIRTY ->r0 bit 30*/
136         andc    r0,r30,r0               /* r0 = pte & ~r0 */
137         rlwimi  r3,r0,32-1,31,31        /* Insert result into PP lsb */
138         ori     r3,r3,HPTE_R_C          /* Always add "C" bit for perf. */
139
140         /* We eventually do the icache sync here (maybe inline that
141          * code rather than call a C function...) 
142          */
143 BEGIN_FTR_SECTION
144         mr      r4,r30
145         mr      r5,r7
146         bl      .hash_page_do_lazy_icache
147 END_FTR_SECTION(CPU_FTR_NOEXECUTE|CPU_FTR_COHERENT_ICACHE, CPU_FTR_NOEXECUTE)
148
149         /* At this point, r3 contains new PP bits, save them in
150          * place of "access" in the param area (sic)
151          */
152         std     r3,STK_PARM(r4)(r1)
153
154         /* Get htab_hash_mask */
155         ld      r4,htab_hash_mask@got(2)
156         ld      r27,0(r4)       /* htab_hash_mask -> r27 */
157
158         /* Check if we may already be in the hashtable, in this case, we
159          * go to out-of-line code to try to modify the HPTE
160          */
161         andi.   r0,r31,_PAGE_HASHPTE
162         bne     htab_modify_pte
163
164 htab_insert_pte:
165         /* Clear hpte bits in new pte (we also clear BUSY btw) and
166          * add _PAGE_HASHPTE
167          */
168         lis     r0,_PAGE_HPTEFLAGS@h
169         ori     r0,r0,_PAGE_HPTEFLAGS@l
170         andc    r30,r30,r0
171         ori     r30,r30,_PAGE_HASHPTE
172
173         /* physical address r5 */
174         rldicl  r5,r31,64-PTE_RPN_SHIFT,PTE_RPN_SHIFT
175         sldi    r5,r5,PAGE_SHIFT
176
177         /* Calculate primary group hash */
178         and     r0,r28,r27
179         rldicr  r3,r0,3,63-3            /* r3 = (hash & mask) << 3 */
180
181         /* Call ppc_md.hpte_insert */
182         ld      r6,STK_PARM(r4)(r1)     /* Retreive new pp bits */
183         mr      r4,r29                  /* Retreive va */
184         li      r7,0                    /* !bolted, !secondary */
185         li      r8,MMU_PAGE_4K          /* page size */
186 _GLOBAL(htab_call_hpte_insert1)
187         bl      .                       /* Patched by htab_finish_init() */
188         cmpdi   0,r3,0
189         bge     htab_pte_insert_ok      /* Insertion successful */
190         cmpdi   0,r3,-2                 /* Critical failure */
191         beq-    htab_pte_insert_failure
192
193         /* Now try secondary slot */
194         
195         /* physical address r5 */
196         rldicl  r5,r31,64-PTE_RPN_SHIFT,PTE_RPN_SHIFT
197         sldi    r5,r5,PAGE_SHIFT
198
199         /* Calculate secondary group hash */
200         andc    r0,r27,r28
201         rldicr  r3,r0,3,63-3    /* r0 = (~hash & mask) << 3 */
202         
203         /* Call ppc_md.hpte_insert */
204         ld      r6,STK_PARM(r4)(r1)     /* Retreive new pp bits */
205         mr      r4,r29                  /* Retreive va */
206         li      r7,HPTE_V_SECONDARY     /* !bolted, secondary */
207         li      r8,MMU_PAGE_4K          /* page size */
208 _GLOBAL(htab_call_hpte_insert2)
209         bl      .                       /* Patched by htab_finish_init() */
210         cmpdi   0,r3,0
211         bge+    htab_pte_insert_ok      /* Insertion successful */
212         cmpdi   0,r3,-2                 /* Critical failure */
213         beq-    htab_pte_insert_failure
214
215         /* Both are full, we need to evict something */
216         mftb    r0
217         /* Pick a random group based on TB */
218         andi.   r0,r0,1
219         mr      r5,r28
220         bne     2f
221         not     r5,r5
222 2:      and     r0,r5,r27
223         rldicr  r3,r0,3,63-3    /* r0 = (hash & mask) << 3 */   
224         /* Call ppc_md.hpte_remove */
225 _GLOBAL(htab_call_hpte_remove)
226         bl      .                       /* Patched by htab_finish_init() */
227
228         /* Try all again */
229         b       htab_insert_pte 
230
231 htab_bail_ok:
232         li      r3,0
233         b       htab_bail
234
235 htab_pte_insert_ok:
236         /* Insert slot number & secondary bit in PTE */
237         rldimi  r30,r3,12,63-15
238                 
239         /* Write out the PTE with a normal write
240          * (maybe add eieio may be good still ?)
241          */
242 htab_write_out_pte:
243         ld      r6,STK_PARM(r6)(r1)
244         std     r30,0(r6)
245         li      r3, 0
246 htab_bail:
247         ld      r27,STK_REG(r27)(r1)
248         ld      r28,STK_REG(r28)(r1)
249         ld      r29,STK_REG(r29)(r1)
250         ld      r30,STK_REG(r30)(r1)
251         ld      r31,STK_REG(r31)(r1)
252         addi    r1,r1,STACKFRAMESIZE
253         ld      r0,16(r1)
254         mtlr    r0
255         blr
256
257 htab_modify_pte:
258         /* Keep PP bits in r4 and slot idx from the PTE around in r3 */
259         mr      r4,r3
260         rlwinm  r3,r31,32-12,29,31
261
262         /* Secondary group ? if yes, get a inverted hash value */
263         mr      r5,r28
264         andi.   r0,r31,_PAGE_SECONDARY
265         beq     1f
266         not     r5,r5
267 1:
268         /* Calculate proper slot value for ppc_md.hpte_updatepp */
269         and     r0,r5,r27
270         rldicr  r0,r0,3,63-3    /* r0 = (hash & mask) << 3 */
271         add     r3,r0,r3        /* add slot idx */
272
273         /* Call ppc_md.hpte_updatepp */
274         mr      r5,r29                  /* va */
275         li      r6,MMU_PAGE_4K          /* page size */
276         ld      r7,STK_PARM(r8)(r1)     /* get "local" param */
277 _GLOBAL(htab_call_hpte_updatepp)
278         bl      .                       /* Patched by htab_finish_init() */
279
280         /* if we failed because typically the HPTE wasn't really here
281          * we try an insertion. 
282          */
283         cmpdi   0,r3,-1
284         beq-    htab_insert_pte
285
286         /* Clear the BUSY bit and Write out the PTE */
287         li      r0,_PAGE_BUSY
288         andc    r30,r30,r0
289         b       htab_write_out_pte
290
291 htab_wrong_access:
292         /* Bail out clearing reservation */
293         stdcx.  r31,0,r6
294         li      r3,1
295         b       htab_bail
296
297 htab_pte_insert_failure:
298         /* Bail out restoring old PTE */
299         ld      r6,STK_PARM(r6)(r1)
300         std     r31,0(r6)
301         li      r3,-1
302         b       htab_bail
303
304
305 #else /* CONFIG_PPC_64K_PAGES */
306
307
308 /*****************************************************************************
309  *                                                                           *
310  *           64K SW & 4K or 64K HW in a 4K segment pages implementation      *
311  *                                                                           *
312  *****************************************************************************/
313
314 /* _hash_page_4K(unsigned long ea, unsigned long access, unsigned long vsid,
315  *               pte_t *ptep, unsigned long trap, int local)
316  */
317
318 /*
319  * For now, we do NOT implement Admixed pages
320  */
321 _GLOBAL(__hash_page_4K)
322         mflr    r0
323         std     r0,16(r1)
324         stdu    r1,-STACKFRAMESIZE(r1)
325         /* Save all params that we need after a function call */
326         std     r6,STK_PARM(r6)(r1)
327         std     r8,STK_PARM(r8)(r1)
328
329         /* Add _PAGE_PRESENT to access */
330         ori     r4,r4,_PAGE_PRESENT
331
332         /* Save non-volatile registers.
333          * r31 will hold "old PTE"
334          * r30 is "new PTE"
335          * r29 is "va"
336          * r28 is a hash value
337          * r27 is hashtab mask (maybe dynamic patched instead ?)
338          * r26 is the hidx mask
339          * r25 is the index in combo page
340          */
341         std     r25,STK_REG(r25)(r1)
342         std     r26,STK_REG(r26)(r1)
343         std     r27,STK_REG(r27)(r1)
344         std     r28,STK_REG(r28)(r1)
345         std     r29,STK_REG(r29)(r1)
346         std     r30,STK_REG(r30)(r1)
347         std     r31,STK_REG(r31)(r1)
348
349         /* Step 1:
350          *
351          * Check permissions, atomically mark the linux PTE busy
352          * and hashed.
353          */
354 1:
355         ldarx   r31,0,r6
356         /* Check access rights (access & ~(pte_val(*ptep))) */
357         andc.   r0,r4,r31
358         bne-    htab_wrong_access
359         /* Check if PTE is busy */
360         andi.   r0,r31,_PAGE_BUSY
361         /* If so, just bail out and refault if needed. Someone else
362          * is changing this PTE anyway and might hash it.
363          */
364         bne-    htab_bail_ok
365         /* Prepare new PTE value (turn access RW into DIRTY, then
366          * add BUSY and ACCESSED)
367          */
368         rlwinm  r30,r4,32-9+7,31-7,31-7 /* _PAGE_RW -> _PAGE_DIRTY */
369         or      r30,r30,r31
370         ori     r30,r30,_PAGE_BUSY | _PAGE_ACCESSED | _PAGE_HASHPTE
371         oris    r30,r30,_PAGE_COMBO@h
372         /* Write the linux PTE atomically (setting busy) */
373         stdcx.  r30,0,r6
374         bne-    1b
375         isync
376
377         /* Step 2:
378          *
379          * Insert/Update the HPTE in the hash table. At this point,
380          * r4 (access) is re-useable, we use it for the new HPTE flags
381          */
382
383         /* Load the hidx index */
384         rldicl  r25,r3,64-12,60
385
386         /* Calc va and put it in r29 */
387         rldicr  r29,r5,28,63-28         /* r29 = (vsid << 28) */
388         rldicl  r3,r3,0,36              /* r3 = (ea & 0x0fffffff) */
389         or      r29,r3,r29              /* r29 = va
390
391         /* Calculate hash value for primary slot and store it in r28 */
392         rldicl  r5,r5,0,25              /* vsid & 0x0000007fffffffff */
393         rldicl  r0,r3,64-12,48          /* (ea >> 12) & 0xffff */
394         xor     r28,r5,r0
395
396         /* Convert linux PTE bits into HW equivalents */
397         andi.   r3,r30,0x1fe            /* Get basic set of flags */
398         xori    r3,r3,HPTE_R_N          /* _PAGE_EXEC -> NOEXEC */
399         rlwinm  r0,r30,32-9+1,30,30     /* _PAGE_RW -> _PAGE_USER (r0) */
400         rlwinm  r4,r30,32-7+1,30,30     /* _PAGE_DIRTY -> _PAGE_USER (r4) */
401         and     r0,r0,r4                /* _PAGE_RW & _PAGE_DIRTY ->r0 bit 30*/
402         andc    r0,r30,r0               /* r0 = pte & ~r0 */
403         rlwimi  r3,r0,32-1,31,31        /* Insert result into PP lsb */
404         ori     r3,r3,HPTE_R_C          /* Always add "C" bit for perf. */
405
406         /* We eventually do the icache sync here (maybe inline that
407          * code rather than call a C function...)
408          */
409 BEGIN_FTR_SECTION
410         mr      r4,r30
411         mr      r5,r7
412         bl      .hash_page_do_lazy_icache
413 END_FTR_SECTION(CPU_FTR_NOEXECUTE|CPU_FTR_COHERENT_ICACHE, CPU_FTR_NOEXECUTE)
414
415         /* At this point, r3 contains new PP bits, save them in
416          * place of "access" in the param area (sic)
417          */
418         std     r3,STK_PARM(r4)(r1)
419
420         /* Get htab_hash_mask */
421         ld      r4,htab_hash_mask@got(2)
422         ld      r27,0(r4)       /* htab_hash_mask -> r27 */
423
424         /* Check if we may already be in the hashtable, in this case, we
425          * go to out-of-line code to try to modify the HPTE. We look for
426          * the bit at (1 >> (index + 32))
427          */
428         andi.   r0,r31,_PAGE_HASHPTE
429         li      r26,0                   /* Default hidx */
430         beq     htab_insert_pte
431
432         /*
433          * Check if the pte was already inserted into the hash table
434          * as a 64k HW page, and invalidate the 64k HPTE if so.
435          */
436         andis.  r0,r31,_PAGE_COMBO@h
437         beq     htab_inval_old_hpte
438
439         ld      r6,STK_PARM(r6)(r1)
440         ori     r26,r6,0x8000           /* Load the hidx mask */
441         ld      r26,0(r26)
442         addi    r5,r25,36               /* Check actual HPTE_SUB bit, this */
443         rldcr.  r0,r31,r5,0             /* must match pgtable.h definition */
444         bne     htab_modify_pte
445
446 htab_insert_pte:
447         /* real page number in r5, PTE RPN value + index */
448         andis.  r0,r31,_PAGE_4K_PFN@h
449         srdi    r5,r31,PTE_RPN_SHIFT
450         bne-    htab_special_pfn
451         sldi    r5,r5,PAGE_SHIFT-HW_PAGE_SHIFT
452         add     r5,r5,r25
453 htab_special_pfn:
454         sldi    r5,r5,HW_PAGE_SHIFT
455
456         /* Calculate primary group hash */
457         and     r0,r28,r27
458         rldicr  r3,r0,3,63-3            /* r0 = (hash & mask) << 3 */
459
460         /* Call ppc_md.hpte_insert */
461         ld      r6,STK_PARM(r4)(r1)     /* Retreive new pp bits */
462         mr      r4,r29                  /* Retreive va */
463         li      r7,0                    /* !bolted, !secondary */
464         li      r8,MMU_PAGE_4K          /* page size */
465 _GLOBAL(htab_call_hpte_insert1)
466         bl      .                       /* patched by htab_finish_init() */
467         cmpdi   0,r3,0
468         bge     htab_pte_insert_ok      /* Insertion successful */
469         cmpdi   0,r3,-2                 /* Critical failure */
470         beq-    htab_pte_insert_failure
471
472         /* Now try secondary slot */
473
474         /* real page number in r5, PTE RPN value + index */
475         rldicl  r5,r31,64-PTE_RPN_SHIFT,PTE_RPN_SHIFT
476         sldi    r5,r5,PAGE_SHIFT-HW_PAGE_SHIFT
477         add     r5,r5,r25
478         sldi    r5,r5,HW_PAGE_SHIFT
479
480         /* Calculate secondary group hash */
481         andc    r0,r27,r28
482         rldicr  r3,r0,3,63-3            /* r0 = (~hash & mask) << 3 */
483
484         /* Call ppc_md.hpte_insert */
485         ld      r6,STK_PARM(r4)(r1)     /* Retreive new pp bits */
486         mr      r4,r29                  /* Retreive va */
487         li      r7,HPTE_V_SECONDARY     /* !bolted, secondary */
488         li      r8,MMU_PAGE_4K          /* page size */
489 _GLOBAL(htab_call_hpte_insert2)
490         bl      .                       /* patched by htab_finish_init() */
491         cmpdi   0,r3,0
492         bge+    htab_pte_insert_ok      /* Insertion successful */
493         cmpdi   0,r3,-2                 /* Critical failure */
494         beq-    htab_pte_insert_failure
495
496         /* Both are full, we need to evict something */
497         mftb    r0
498         /* Pick a random group based on TB */
499         andi.   r0,r0,1
500         mr      r5,r28
501         bne     2f
502         not     r5,r5
503 2:      and     r0,r5,r27
504         rldicr  r3,r0,3,63-3            /* r0 = (hash & mask) << 3 */
505         /* Call ppc_md.hpte_remove */
506 _GLOBAL(htab_call_hpte_remove)
507         bl      .                       /* patched by htab_finish_init() */
508
509         /* Try all again */
510         b       htab_insert_pte
511
512         /*
513          * Call out to C code to invalidate an 64k HW HPTE that is
514          * useless now that the segment has been switched to 4k pages.
515          */
516 htab_inval_old_hpte:
517         mr      r3,r29                  /* virtual addr */
518         mr      r4,r31                  /* PTE.pte */
519         li      r5,0                    /* PTE.hidx */
520         li      r6,MMU_PAGE_64K         /* psize */
521         ld      r7,STK_PARM(r8)(r1)     /* local */
522         bl      .flush_hash_page
523         b       htab_insert_pte
524         
525 htab_bail_ok:
526         li      r3,0
527         b       htab_bail
528
529 htab_pte_insert_ok:
530         /* Insert slot number & secondary bit in PTE second half,
531          * clear _PAGE_BUSY and set approriate HPTE slot bit
532          */
533         ld      r6,STK_PARM(r6)(r1)
534         li      r0,_PAGE_BUSY
535         andc    r30,r30,r0
536         /* HPTE SUB bit */
537         li      r0,1
538         subfic  r5,r25,27               /* Must match bit position in */
539         sld     r0,r0,r5                /* pgtable.h */
540         or      r30,r30,r0
541         /* hindx */
542         sldi    r5,r25,2
543         sld     r3,r3,r5
544         li      r4,0xf
545         sld     r4,r4,r5
546         andc    r26,r26,r4
547         or      r26,r26,r3
548         ori     r5,r6,0x8000
549         std     r26,0(r5)
550         lwsync
551         std     r30,0(r6)
552         li      r3, 0
553 htab_bail:
554         ld      r25,STK_REG(r25)(r1)
555         ld      r26,STK_REG(r26)(r1)
556         ld      r27,STK_REG(r27)(r1)
557         ld      r28,STK_REG(r28)(r1)
558         ld      r29,STK_REG(r29)(r1)
559         ld      r30,STK_REG(r30)(r1)
560         ld      r31,STK_REG(r31)(r1)
561         addi    r1,r1,STACKFRAMESIZE
562         ld      r0,16(r1)
563         mtlr    r0
564         blr
565
566 htab_modify_pte:
567         /* Keep PP bits in r4 and slot idx from the PTE around in r3 */
568         mr      r4,r3
569         sldi    r5,r25,2
570         srd     r3,r26,r5
571
572         /* Secondary group ? if yes, get a inverted hash value */
573         mr      r5,r28
574         andi.   r0,r3,0x8 /* page secondary ? */
575         beq     1f
576         not     r5,r5
577 1:      andi.   r3,r3,0x7 /* extract idx alone */
578
579         /* Calculate proper slot value for ppc_md.hpte_updatepp */
580         and     r0,r5,r27
581         rldicr  r0,r0,3,63-3    /* r0 = (hash & mask) << 3 */
582         add     r3,r0,r3        /* add slot idx */
583
584         /* Call ppc_md.hpte_updatepp */
585         mr      r5,r29                  /* va */
586         li      r6,MMU_PAGE_4K          /* page size */
587         ld      r7,STK_PARM(r8)(r1)     /* get "local" param */
588 _GLOBAL(htab_call_hpte_updatepp)
589         bl      .                       /* patched by htab_finish_init() */
590
591         /* if we failed because typically the HPTE wasn't really here
592          * we try an insertion.
593          */
594         cmpdi   0,r3,-1
595         beq-    htab_insert_pte
596
597         /* Clear the BUSY bit and Write out the PTE */
598         li      r0,_PAGE_BUSY
599         andc    r30,r30,r0
600         ld      r6,STK_PARM(r6)(r1)
601         std     r30,0(r6)
602         li      r3,0
603         b       htab_bail
604
605 htab_wrong_access:
606         /* Bail out clearing reservation */
607         stdcx.  r31,0,r6
608         li      r3,1
609         b       htab_bail
610
611 htab_pte_insert_failure:
612         /* Bail out restoring old PTE */
613         ld      r6,STK_PARM(r6)(r1)
614         std     r31,0(r6)
615         li      r3,-1
616         b       htab_bail
617
618
619 /*****************************************************************************
620  *                                                                           *
621  *           64K SW & 64K HW in a 64K segment pages implementation           *
622  *                                                                           *
623  *****************************************************************************/
624
625 _GLOBAL(__hash_page_64K)
626         mflr    r0
627         std     r0,16(r1)
628         stdu    r1,-STACKFRAMESIZE(r1)
629         /* Save all params that we need after a function call */
630         std     r6,STK_PARM(r6)(r1)
631         std     r8,STK_PARM(r8)(r1)
632
633         /* Add _PAGE_PRESENT to access */
634         ori     r4,r4,_PAGE_PRESENT
635
636         /* Save non-volatile registers.
637          * r31 will hold "old PTE"
638          * r30 is "new PTE"
639          * r29 is "va"
640          * r28 is a hash value
641          * r27 is hashtab mask (maybe dynamic patched instead ?)
642          */
643         std     r27,STK_REG(r27)(r1)
644         std     r28,STK_REG(r28)(r1)
645         std     r29,STK_REG(r29)(r1)
646         std     r30,STK_REG(r30)(r1)
647         std     r31,STK_REG(r31)(r1)
648
649         /* Step 1:
650          *
651          * Check permissions, atomically mark the linux PTE busy
652          * and hashed.
653          */
654 1:
655         ldarx   r31,0,r6
656         /* Check access rights (access & ~(pte_val(*ptep))) */
657         andc.   r0,r4,r31
658         bne-    ht64_wrong_access
659         /* Check if PTE is busy */
660         andi.   r0,r31,_PAGE_BUSY
661         /* If so, just bail out and refault if needed. Someone else
662          * is changing this PTE anyway and might hash it.
663          */
664         bne-    ht64_bail_ok
665 BEGIN_FTR_SECTION
666         /* Check if PTE has the cache-inhibit bit set */
667         andi.   r0,r31,_PAGE_NO_CACHE
668         /* If so, bail out and refault as a 4k page */
669         bne-    ht64_bail_ok
670 END_FTR_SECTION_IFCLR(CPU_FTR_CI_LARGE_PAGE)
671         /* Prepare new PTE value (turn access RW into DIRTY, then
672          * add BUSY,HASHPTE and ACCESSED)
673          */
674         rlwinm  r30,r4,32-9+7,31-7,31-7 /* _PAGE_RW -> _PAGE_DIRTY */
675         or      r30,r30,r31
676         ori     r30,r30,_PAGE_BUSY | _PAGE_ACCESSED | _PAGE_HASHPTE
677         /* Write the linux PTE atomically (setting busy) */
678         stdcx.  r30,0,r6
679         bne-    1b
680         isync
681
682         /* Step 2:
683          *
684          * Insert/Update the HPTE in the hash table. At this point,
685          * r4 (access) is re-useable, we use it for the new HPTE flags
686          */
687
688         /* Calc va and put it in r29 */
689         rldicr  r29,r5,28,63-28
690         rldicl  r3,r3,0,36
691         or      r29,r3,r29
692
693         /* Calculate hash value for primary slot and store it in r28 */
694         rldicl  r5,r5,0,25              /* vsid & 0x0000007fffffffff */
695         rldicl  r0,r3,64-16,52          /* (ea >> 16) & 0xfff */
696         xor     r28,r5,r0
697
698         /* Convert linux PTE bits into HW equivalents */
699         andi.   r3,r30,0x1fe            /* Get basic set of flags */
700         xori    r3,r3,HPTE_R_N          /* _PAGE_EXEC -> NOEXEC */
701         rlwinm  r0,r30,32-9+1,30,30     /* _PAGE_RW -> _PAGE_USER (r0) */
702         rlwinm  r4,r30,32-7+1,30,30     /* _PAGE_DIRTY -> _PAGE_USER (r4) */
703         and     r0,r0,r4                /* _PAGE_RW & _PAGE_DIRTY ->r0 bit 30*/
704         andc    r0,r30,r0               /* r0 = pte & ~r0 */
705         rlwimi  r3,r0,32-1,31,31        /* Insert result into PP lsb */
706         ori     r3,r3,HPTE_R_C          /* Always add "C" bit for perf. */
707
708         /* We eventually do the icache sync here (maybe inline that
709          * code rather than call a C function...)
710          */
711 BEGIN_FTR_SECTION
712         mr      r4,r30
713         mr      r5,r7
714         bl      .hash_page_do_lazy_icache
715 END_FTR_SECTION(CPU_FTR_NOEXECUTE|CPU_FTR_COHERENT_ICACHE, CPU_FTR_NOEXECUTE)
716
717         /* At this point, r3 contains new PP bits, save them in
718          * place of "access" in the param area (sic)
719          */
720         std     r3,STK_PARM(r4)(r1)
721
722         /* Get htab_hash_mask */
723         ld      r4,htab_hash_mask@got(2)
724         ld      r27,0(r4)       /* htab_hash_mask -> r27 */
725
726         /* Check if we may already be in the hashtable, in this case, we
727          * go to out-of-line code to try to modify the HPTE
728          */
729         andi.   r0,r31,_PAGE_HASHPTE
730         bne     ht64_modify_pte
731
732 ht64_insert_pte:
733         /* Clear hpte bits in new pte (we also clear BUSY btw) and
734          * add _PAGE_HASHPTE
735          */
736         lis     r0,_PAGE_HPTEFLAGS@h
737         ori     r0,r0,_PAGE_HPTEFLAGS@l
738         andc    r30,r30,r0
739         ori     r30,r30,_PAGE_HASHPTE
740
741         /* Phyical address in r5 */
742         rldicl  r5,r31,64-PTE_RPN_SHIFT,PTE_RPN_SHIFT
743         sldi    r5,r5,PAGE_SHIFT
744
745         /* Calculate primary group hash */
746         and     r0,r28,r27
747         rldicr  r3,r0,3,63-3    /* r0 = (hash & mask) << 3 */
748
749         /* Call ppc_md.hpte_insert */
750         ld      r6,STK_PARM(r4)(r1)     /* Retreive new pp bits */
751         mr      r4,r29                  /* Retreive va */
752         li      r7,0                    /* !bolted, !secondary */
753         li      r8,MMU_PAGE_64K
754 _GLOBAL(ht64_call_hpte_insert1)
755         bl      .                       /* patched by htab_finish_init() */
756         cmpdi   0,r3,0
757         bge     ht64_pte_insert_ok      /* Insertion successful */
758         cmpdi   0,r3,-2                 /* Critical failure */
759         beq-    ht64_pte_insert_failure
760
761         /* Now try secondary slot */
762
763         /* Phyical address in r5 */
764         rldicl  r5,r31,64-PTE_RPN_SHIFT,PTE_RPN_SHIFT
765         sldi    r5,r5,PAGE_SHIFT
766
767         /* Calculate secondary group hash */
768         andc    r0,r27,r28
769         rldicr  r3,r0,3,63-3    /* r0 = (~hash & mask) << 3 */
770
771         /* Call ppc_md.hpte_insert */
772         ld      r6,STK_PARM(r4)(r1)     /* Retreive new pp bits */
773         mr      r4,r29                  /* Retreive va */
774         li      r7,HPTE_V_SECONDARY     /* !bolted, secondary */
775         li      r8,MMU_PAGE_64K
776 _GLOBAL(ht64_call_hpte_insert2)
777         bl      .                       /* patched by htab_finish_init() */
778         cmpdi   0,r3,0
779         bge+    ht64_pte_insert_ok      /* Insertion successful */
780         cmpdi   0,r3,-2                 /* Critical failure */
781         beq-    ht64_pte_insert_failure
782
783         /* Both are full, we need to evict something */
784         mftb    r0
785         /* Pick a random group based on TB */
786         andi.   r0,r0,1
787         mr      r5,r28
788         bne     2f
789         not     r5,r5
790 2:      and     r0,r5,r27
791         rldicr  r3,r0,3,63-3    /* r0 = (hash & mask) << 3 */
792         /* Call ppc_md.hpte_remove */
793 _GLOBAL(ht64_call_hpte_remove)
794         bl      .                       /* patched by htab_finish_init() */
795
796         /* Try all again */
797         b       ht64_insert_pte
798
799 ht64_bail_ok:
800         li      r3,0
801         b       ht64_bail
802
803 ht64_pte_insert_ok:
804         /* Insert slot number & secondary bit in PTE */
805         rldimi  r30,r3,12,63-15
806
807         /* Write out the PTE with a normal write
808          * (maybe add eieio may be good still ?)
809          */
810 ht64_write_out_pte:
811         ld      r6,STK_PARM(r6)(r1)
812         std     r30,0(r6)
813         li      r3, 0
814 ht64_bail:
815         ld      r27,STK_REG(r27)(r1)
816         ld      r28,STK_REG(r28)(r1)
817         ld      r29,STK_REG(r29)(r1)
818         ld      r30,STK_REG(r30)(r1)
819         ld      r31,STK_REG(r31)(r1)
820         addi    r1,r1,STACKFRAMESIZE
821         ld      r0,16(r1)
822         mtlr    r0
823         blr
824
825 ht64_modify_pte:
826         /* Keep PP bits in r4 and slot idx from the PTE around in r3 */
827         mr      r4,r3
828         rlwinm  r3,r31,32-12,29,31
829
830         /* Secondary group ? if yes, get a inverted hash value */
831         mr      r5,r28
832         andi.   r0,r31,_PAGE_F_SECOND
833         beq     1f
834         not     r5,r5
835 1:
836         /* Calculate proper slot value for ppc_md.hpte_updatepp */
837         and     r0,r5,r27
838         rldicr  r0,r0,3,63-3    /* r0 = (hash & mask) << 3 */
839         add     r3,r0,r3        /* add slot idx */
840
841         /* Call ppc_md.hpte_updatepp */
842         mr      r5,r29                  /* va */
843         li      r6,MMU_PAGE_64K
844         ld      r7,STK_PARM(r8)(r1)     /* get "local" param */
845 _GLOBAL(ht64_call_hpte_updatepp)
846         bl      .                       /* patched by htab_finish_init() */
847
848         /* if we failed because typically the HPTE wasn't really here
849          * we try an insertion.
850          */
851         cmpdi   0,r3,-1
852         beq-    ht64_insert_pte
853
854         /* Clear the BUSY bit and Write out the PTE */
855         li      r0,_PAGE_BUSY
856         andc    r30,r30,r0
857         b       ht64_write_out_pte
858
859 ht64_wrong_access:
860         /* Bail out clearing reservation */
861         stdcx.  r31,0,r6
862         li      r3,1
863         b       ht64_bail
864
865 ht64_pte_insert_failure:
866         /* Bail out restoring old PTE */
867         ld      r6,STK_PARM(r6)(r1)
868         std     r31,0(r6)
869         li      r3,-1
870         b       ht64_bail
871
872
873 #endif /* CONFIG_PPC_64K_PAGES */
874
875
876 /*****************************************************************************
877  *                                                                           *
878  *           Huge pages implementation is in hugetlbpage.c                   *
879  *                                                                           *
880  *****************************************************************************/