[PATCH] set EXIT_DEAD state in do_exit(), not in schedule()
authorOleg Nesterov <oleg@tv-sign.ru>
Fri, 29 Sep 2006 09:01:09 +0000 (02:01 -0700)
committerLinus Torvalds <torvalds@g5.osdl.org>
Fri, 29 Sep 2006 16:18:20 +0000 (09:18 -0700)
schedule() checks PF_DEAD on every context switch and sets ->state = EXIT_DEAD
to ensure that the exiting task will be deactivated.  Note that this EXIT_DEAD
is in fact a "random" value, we can use any bit except normal TASK_XXX values.

It is better to set this state in do_exit() along with PF_DEAD flag and remove
that check in schedule().

We are safe wrt concurrent try_to_wake_up() (for example ptrace, tkill), it
can not change task's ->state: the 'state' argument of try_to_wake_up() can't
have EXIT_DEAD bit.  And in case when try_to_wake_up() sees a stale value of
->state == TASK_RUNNING it will do nothing.

Signed-off-by: Oleg Nesterov <oleg@tv-sign.ru>
Cc: Ingo Molnar <mingo@elte.hu>
Signed-off-by: Andrew Morton <akpm@osdl.org>
Signed-off-by: Linus Torvalds <torvalds@osdl.org>
kernel/exit.c
kernel/sched.c

index 4a280856acd2e8db9252c3e3f340b499b7edafc2..3d759c98fb1196d2b25dc733ead29406fb38dca3 100644 (file)
@@ -957,6 +957,7 @@ fastcall NORET_TYPE void do_exit(long code)
        preempt_disable();
        BUG_ON(tsk->flags & PF_DEAD);
        tsk->flags |= PF_DEAD;
+       tsk->state = EXIT_DEAD;
 
        schedule();
        BUG();
index 155a33da7aa76ca733977c9b934042551ca2e7f0..e1646b044b69470c089a318765cd87e22a60caee 100644 (file)
@@ -3348,9 +3348,6 @@ need_resched_nonpreemptible:
 
        spin_lock_irq(&rq->lock);
 
-       if (unlikely(prev->flags & PF_DEAD))
-               prev->state = EXIT_DEAD;
-
        switch_count = &prev->nivcsw;
        if (prev->state && !(preempt_count() & PREEMPT_ACTIVE)) {
                switch_count = &prev->nvcsw;