Merge branch 'acpi-ec'
[linux-drm-fsl-dcu.git] / drivers / ata / libata-eh.c
1 /*
2  *  libata-eh.c - libata error handling
3  *
4  *  Maintained by:  Tejun Heo <tj@kernel.org>
5  *                  Please ALWAYS copy linux-ide@vger.kernel.org
6  *                  on emails.
7  *
8  *  Copyright 2006 Tejun Heo <htejun@gmail.com>
9  *
10  *
11  *  This program is free software; you can redistribute it and/or
12  *  modify it under the terms of the GNU General Public License as
13  *  published by the Free Software Foundation; either version 2, or
14  *  (at your option) any later version.
15  *
16  *  This program is distributed in the hope that it will be useful,
17  *  but WITHOUT ANY WARRANTY; without even the implied warranty of
18  *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
19  *  General Public License for more details.
20  *
21  *  You should have received a copy of the GNU General Public License
22  *  along with this program; see the file COPYING.  If not, write to
23  *  the Free Software Foundation, 675 Mass Ave, Cambridge, MA 02139,
24  *  USA.
25  *
26  *
27  *  libata documentation is available via 'make {ps|pdf}docs',
28  *  as Documentation/DocBook/libata.*
29  *
30  *  Hardware documentation available from http://www.t13.org/ and
31  *  http://www.sata-io.org/
32  *
33  */
34
35 #include <linux/kernel.h>
36 #include <linux/blkdev.h>
37 #include <linux/export.h>
38 #include <linux/pci.h>
39 #include <scsi/scsi.h>
40 #include <scsi/scsi_host.h>
41 #include <scsi/scsi_eh.h>
42 #include <scsi/scsi_device.h>
43 #include <scsi/scsi_cmnd.h>
44 #include <scsi/scsi_dbg.h>
45 #include "../scsi/scsi_transport_api.h"
46
47 #include <linux/libata.h>
48
49 #include "libata.h"
50
51 enum {
52         /* speed down verdicts */
53         ATA_EH_SPDN_NCQ_OFF             = (1 << 0),
54         ATA_EH_SPDN_SPEED_DOWN          = (1 << 1),
55         ATA_EH_SPDN_FALLBACK_TO_PIO     = (1 << 2),
56         ATA_EH_SPDN_KEEP_ERRORS         = (1 << 3),
57
58         /* error flags */
59         ATA_EFLAG_IS_IO                 = (1 << 0),
60         ATA_EFLAG_DUBIOUS_XFER          = (1 << 1),
61         ATA_EFLAG_OLD_ER                = (1 << 31),
62
63         /* error categories */
64         ATA_ECAT_NONE                   = 0,
65         ATA_ECAT_ATA_BUS                = 1,
66         ATA_ECAT_TOUT_HSM               = 2,
67         ATA_ECAT_UNK_DEV                = 3,
68         ATA_ECAT_DUBIOUS_NONE           = 4,
69         ATA_ECAT_DUBIOUS_ATA_BUS        = 5,
70         ATA_ECAT_DUBIOUS_TOUT_HSM       = 6,
71         ATA_ECAT_DUBIOUS_UNK_DEV        = 7,
72         ATA_ECAT_NR                     = 8,
73
74         ATA_EH_CMD_DFL_TIMEOUT          =  5000,
75
76         /* always put at least this amount of time between resets */
77         ATA_EH_RESET_COOL_DOWN          =  5000,
78
79         /* Waiting in ->prereset can never be reliable.  It's
80          * sometimes nice to wait there but it can't be depended upon;
81          * otherwise, we wouldn't be resetting.  Just give it enough
82          * time for most drives to spin up.
83          */
84         ATA_EH_PRERESET_TIMEOUT         = 10000,
85         ATA_EH_FASTDRAIN_INTERVAL       =  3000,
86
87         ATA_EH_UA_TRIES                 = 5,
88
89         /* probe speed down parameters, see ata_eh_schedule_probe() */
90         ATA_EH_PROBE_TRIAL_INTERVAL     = 60000,        /* 1 min */
91         ATA_EH_PROBE_TRIALS             = 2,
92 };
93
94 /* The following table determines how we sequence resets.  Each entry
95  * represents timeout for that try.  The first try can be soft or
96  * hardreset.  All others are hardreset if available.  In most cases
97  * the first reset w/ 10sec timeout should succeed.  Following entries
98  * are mostly for error handling, hotplug and those outlier devices that
99  * take an exceptionally long time to recover from reset.
100  */
101 static const unsigned long ata_eh_reset_timeouts[] = {
102         10000,  /* most drives spin up by 10sec */
103         10000,  /* > 99% working drives spin up before 20sec */
104         35000,  /* give > 30 secs of idleness for outlier devices */
105          5000,  /* and sweet one last chance */
106         ULONG_MAX, /* > 1 min has elapsed, give up */
107 };
108
109 static const unsigned long ata_eh_identify_timeouts[] = {
110          5000,  /* covers > 99% of successes and not too boring on failures */
111         10000,  /* combined time till here is enough even for media access */
112         30000,  /* for true idiots */
113         ULONG_MAX,
114 };
115
116 static const unsigned long ata_eh_flush_timeouts[] = {
117         15000,  /* be generous with flush */
118         15000,  /* ditto */
119         30000,  /* and even more generous */
120         ULONG_MAX,
121 };
122
123 static const unsigned long ata_eh_other_timeouts[] = {
124          5000,  /* same rationale as identify timeout */
125         10000,  /* ditto */
126         /* but no merciful 30sec for other commands, it just isn't worth it */
127         ULONG_MAX,
128 };
129
130 struct ata_eh_cmd_timeout_ent {
131         const u8                *commands;
132         const unsigned long     *timeouts;
133 };
134
135 /* The following table determines timeouts to use for EH internal
136  * commands.  Each table entry is a command class and matches the
137  * commands the entry applies to and the timeout table to use.
138  *
139  * On the retry after a command timed out, the next timeout value from
140  * the table is used.  If the table doesn't contain further entries,
141  * the last value is used.
142  *
143  * ehc->cmd_timeout_idx keeps track of which timeout to use per
144  * command class, so if SET_FEATURES times out on the first try, the
145  * next try will use the second timeout value only for that class.
146  */
147 #define CMDS(cmds...)   (const u8 []){ cmds, 0 }
148 static const struct ata_eh_cmd_timeout_ent
149 ata_eh_cmd_timeout_table[ATA_EH_CMD_TIMEOUT_TABLE_SIZE] = {
150         { .commands = CMDS(ATA_CMD_ID_ATA, ATA_CMD_ID_ATAPI),
151           .timeouts = ata_eh_identify_timeouts, },
152         { .commands = CMDS(ATA_CMD_READ_NATIVE_MAX, ATA_CMD_READ_NATIVE_MAX_EXT),
153           .timeouts = ata_eh_other_timeouts, },
154         { .commands = CMDS(ATA_CMD_SET_MAX, ATA_CMD_SET_MAX_EXT),
155           .timeouts = ata_eh_other_timeouts, },
156         { .commands = CMDS(ATA_CMD_SET_FEATURES),
157           .timeouts = ata_eh_other_timeouts, },
158         { .commands = CMDS(ATA_CMD_INIT_DEV_PARAMS),
159           .timeouts = ata_eh_other_timeouts, },
160         { .commands = CMDS(ATA_CMD_FLUSH, ATA_CMD_FLUSH_EXT),
161           .timeouts = ata_eh_flush_timeouts },
162 };
163 #undef CMDS
164
165 static void __ata_port_freeze(struct ata_port *ap);
166 #ifdef CONFIG_PM
167 static void ata_eh_handle_port_suspend(struct ata_port *ap);
168 static void ata_eh_handle_port_resume(struct ata_port *ap);
169 #else /* CONFIG_PM */
170 static void ata_eh_handle_port_suspend(struct ata_port *ap)
171 { }
172
173 static void ata_eh_handle_port_resume(struct ata_port *ap)
174 { }
175 #endif /* CONFIG_PM */
176
177 static void __ata_ehi_pushv_desc(struct ata_eh_info *ehi, const char *fmt,
178                                  va_list args)
179 {
180         ehi->desc_len += vscnprintf(ehi->desc + ehi->desc_len,
181                                      ATA_EH_DESC_LEN - ehi->desc_len,
182                                      fmt, args);
183 }
184
185 /**
186  *      __ata_ehi_push_desc - push error description without adding separator
187  *      @ehi: target EHI
188  *      @fmt: printf format string
189  *
190  *      Format string according to @fmt and append it to @ehi->desc.
191  *
192  *      LOCKING:
193  *      spin_lock_irqsave(host lock)
194  */
195 void __ata_ehi_push_desc(struct ata_eh_info *ehi, const char *fmt, ...)
196 {
197         va_list args;
198
199         va_start(args, fmt);
200         __ata_ehi_pushv_desc(ehi, fmt, args);
201         va_end(args);
202 }
203
204 /**
205  *      ata_ehi_push_desc - push error description with separator
206  *      @ehi: target EHI
207  *      @fmt: printf format string
208  *
209  *      Format string according to @fmt and append it to @ehi->desc.
210  *      If @ehi->desc is not empty, ", " is added in-between.
211  *
212  *      LOCKING:
213  *      spin_lock_irqsave(host lock)
214  */
215 void ata_ehi_push_desc(struct ata_eh_info *ehi, const char *fmt, ...)
216 {
217         va_list args;
218
219         if (ehi->desc_len)
220                 __ata_ehi_push_desc(ehi, ", ");
221
222         va_start(args, fmt);
223         __ata_ehi_pushv_desc(ehi, fmt, args);
224         va_end(args);
225 }
226
227 /**
228  *      ata_ehi_clear_desc - clean error description
229  *      @ehi: target EHI
230  *
231  *      Clear @ehi->desc.
232  *
233  *      LOCKING:
234  *      spin_lock_irqsave(host lock)
235  */
236 void ata_ehi_clear_desc(struct ata_eh_info *ehi)
237 {
238         ehi->desc[0] = '\0';
239         ehi->desc_len = 0;
240 }
241
242 /**
243  *      ata_port_desc - append port description
244  *      @ap: target ATA port
245  *      @fmt: printf format string
246  *
247  *      Format string according to @fmt and append it to port
248  *      description.  If port description is not empty, " " is added
249  *      in-between.  This function is to be used while initializing
250  *      ata_host.  The description is printed on host registration.
251  *
252  *      LOCKING:
253  *      None.
254  */
255 void ata_port_desc(struct ata_port *ap, const char *fmt, ...)
256 {
257         va_list args;
258
259         WARN_ON(!(ap->pflags & ATA_PFLAG_INITIALIZING));
260
261         if (ap->link.eh_info.desc_len)
262                 __ata_ehi_push_desc(&ap->link.eh_info, " ");
263
264         va_start(args, fmt);
265         __ata_ehi_pushv_desc(&ap->link.eh_info, fmt, args);
266         va_end(args);
267 }
268
269 #ifdef CONFIG_PCI
270
271 /**
272  *      ata_port_pbar_desc - append PCI BAR description
273  *      @ap: target ATA port
274  *      @bar: target PCI BAR
275  *      @offset: offset into PCI BAR
276  *      @name: name of the area
277  *
278  *      If @offset is negative, this function formats a string which
279  *      contains the name, address, size and type of the BAR and
280  *      appends it to the port description.  If @offset is zero or
281  *      positive, only name and offsetted address is appended.
282  *
283  *      LOCKING:
284  *      None.
285  */
286 void ata_port_pbar_desc(struct ata_port *ap, int bar, ssize_t offset,
287                         const char *name)
288 {
289         struct pci_dev *pdev = to_pci_dev(ap->host->dev);
290         char *type = "";
291         unsigned long long start, len;
292
293         if (pci_resource_flags(pdev, bar) & IORESOURCE_MEM)
294                 type = "m";
295         else if (pci_resource_flags(pdev, bar) & IORESOURCE_IO)
296                 type = "i";
297
298         start = (unsigned long long)pci_resource_start(pdev, bar);
299         len = (unsigned long long)pci_resource_len(pdev, bar);
300
301         if (offset < 0)
302                 ata_port_desc(ap, "%s %s%llu@0x%llx", name, type, len, start);
303         else
304                 ata_port_desc(ap, "%s 0x%llx", name,
305                                 start + (unsigned long long)offset);
306 }
307
308 #endif /* CONFIG_PCI */
309
310 static int ata_lookup_timeout_table(u8 cmd)
311 {
312         int i;
313
314         for (i = 0; i < ATA_EH_CMD_TIMEOUT_TABLE_SIZE; i++) {
315                 const u8 *cur;
316
317                 for (cur = ata_eh_cmd_timeout_table[i].commands; *cur; cur++)
318                         if (*cur == cmd)
319                                 return i;
320         }
321
322         return -1;
323 }
324
325 /**
326  *      ata_internal_cmd_timeout - determine timeout for an internal command
327  *      @dev: target device
328  *      @cmd: internal command to be issued
329  *
330  *      Determine timeout for internal command @cmd for @dev.
331  *
332  *      LOCKING:
333  *      EH context.
334  *
335  *      RETURNS:
336  *      Determined timeout.
337  */
338 unsigned long ata_internal_cmd_timeout(struct ata_device *dev, u8 cmd)
339 {
340         struct ata_eh_context *ehc = &dev->link->eh_context;
341         int ent = ata_lookup_timeout_table(cmd);
342         int idx;
343
344         if (ent < 0)
345                 return ATA_EH_CMD_DFL_TIMEOUT;
346
347         idx = ehc->cmd_timeout_idx[dev->devno][ent];
348         return ata_eh_cmd_timeout_table[ent].timeouts[idx];
349 }
350
351 /**
352  *      ata_internal_cmd_timed_out - notification for internal command timeout
353  *      @dev: target device
354  *      @cmd: internal command which timed out
355  *
356  *      Notify EH that internal command @cmd for @dev timed out.  This
357  *      function should be called only for commands whose timeouts are
358  *      determined using ata_internal_cmd_timeout().
359  *
360  *      LOCKING:
361  *      EH context.
362  */
363 void ata_internal_cmd_timed_out(struct ata_device *dev, u8 cmd)
364 {
365         struct ata_eh_context *ehc = &dev->link->eh_context;
366         int ent = ata_lookup_timeout_table(cmd);
367         int idx;
368
369         if (ent < 0)
370                 return;
371
372         idx = ehc->cmd_timeout_idx[dev->devno][ent];
373         if (ata_eh_cmd_timeout_table[ent].timeouts[idx + 1] != ULONG_MAX)
374                 ehc->cmd_timeout_idx[dev->devno][ent]++;
375 }
376
377 static void ata_ering_record(struct ata_ering *ering, unsigned int eflags,
378                              unsigned int err_mask)
379 {
380         struct ata_ering_entry *ent;
381
382         WARN_ON(!err_mask);
383
384         ering->cursor++;
385         ering->cursor %= ATA_ERING_SIZE;
386
387         ent = &ering->ring[ering->cursor];
388         ent->eflags = eflags;
389         ent->err_mask = err_mask;
390         ent->timestamp = get_jiffies_64();
391 }
392
393 static struct ata_ering_entry *ata_ering_top(struct ata_ering *ering)
394 {
395         struct ata_ering_entry *ent = &ering->ring[ering->cursor];
396
397         if (ent->err_mask)
398                 return ent;
399         return NULL;
400 }
401
402 int ata_ering_map(struct ata_ering *ering,
403                   int (*map_fn)(struct ata_ering_entry *, void *),
404                   void *arg)
405 {
406         int idx, rc = 0;
407         struct ata_ering_entry *ent;
408
409         idx = ering->cursor;
410         do {
411                 ent = &ering->ring[idx];
412                 if (!ent->err_mask)
413                         break;
414                 rc = map_fn(ent, arg);
415                 if (rc)
416                         break;
417                 idx = (idx - 1 + ATA_ERING_SIZE) % ATA_ERING_SIZE;
418         } while (idx != ering->cursor);
419
420         return rc;
421 }
422
423 static int ata_ering_clear_cb(struct ata_ering_entry *ent, void *void_arg)
424 {
425         ent->eflags |= ATA_EFLAG_OLD_ER;
426         return 0;
427 }
428
429 static void ata_ering_clear(struct ata_ering *ering)
430 {
431         ata_ering_map(ering, ata_ering_clear_cb, NULL);
432 }
433
434 static unsigned int ata_eh_dev_action(struct ata_device *dev)
435 {
436         struct ata_eh_context *ehc = &dev->link->eh_context;
437
438         return ehc->i.action | ehc->i.dev_action[dev->devno];
439 }
440
441 static void ata_eh_clear_action(struct ata_link *link, struct ata_device *dev,
442                                 struct ata_eh_info *ehi, unsigned int action)
443 {
444         struct ata_device *tdev;
445
446         if (!dev) {
447                 ehi->action &= ~action;
448                 ata_for_each_dev(tdev, link, ALL)
449                         ehi->dev_action[tdev->devno] &= ~action;
450         } else {
451                 /* doesn't make sense for port-wide EH actions */
452                 WARN_ON(!(action & ATA_EH_PERDEV_MASK));
453
454                 /* break ehi->action into ehi->dev_action */
455                 if (ehi->action & action) {
456                         ata_for_each_dev(tdev, link, ALL)
457                                 ehi->dev_action[tdev->devno] |=
458                                         ehi->action & action;
459                         ehi->action &= ~action;
460                 }
461
462                 /* turn off the specified per-dev action */
463                 ehi->dev_action[dev->devno] &= ~action;
464         }
465 }
466
467 /**
468  *      ata_eh_acquire - acquire EH ownership
469  *      @ap: ATA port to acquire EH ownership for
470  *
471  *      Acquire EH ownership for @ap.  This is the basic exclusion
472  *      mechanism for ports sharing a host.  Only one port hanging off
473  *      the same host can claim the ownership of EH.
474  *
475  *      LOCKING:
476  *      EH context.
477  */
478 void ata_eh_acquire(struct ata_port *ap)
479 {
480         mutex_lock(&ap->host->eh_mutex);
481         WARN_ON_ONCE(ap->host->eh_owner);
482         ap->host->eh_owner = current;
483 }
484
485 /**
486  *      ata_eh_release - release EH ownership
487  *      @ap: ATA port to release EH ownership for
488  *
489  *      Release EH ownership for @ap if the caller.  The caller must
490  *      have acquired EH ownership using ata_eh_acquire() previously.
491  *
492  *      LOCKING:
493  *      EH context.
494  */
495 void ata_eh_release(struct ata_port *ap)
496 {
497         WARN_ON_ONCE(ap->host->eh_owner != current);
498         ap->host->eh_owner = NULL;
499         mutex_unlock(&ap->host->eh_mutex);
500 }
501
502 /**
503  *      ata_scsi_timed_out - SCSI layer time out callback
504  *      @cmd: timed out SCSI command
505  *
506  *      Handles SCSI layer timeout.  We race with normal completion of
507  *      the qc for @cmd.  If the qc is already gone, we lose and let
508  *      the scsi command finish (EH_HANDLED).  Otherwise, the qc has
509  *      timed out and EH should be invoked.  Prevent ata_qc_complete()
510  *      from finishing it by setting EH_SCHEDULED and return
511  *      EH_NOT_HANDLED.
512  *
513  *      TODO: kill this function once old EH is gone.
514  *
515  *      LOCKING:
516  *      Called from timer context
517  *
518  *      RETURNS:
519  *      EH_HANDLED or EH_NOT_HANDLED
520  */
521 enum blk_eh_timer_return ata_scsi_timed_out(struct scsi_cmnd *cmd)
522 {
523         struct Scsi_Host *host = cmd->device->host;
524         struct ata_port *ap = ata_shost_to_port(host);
525         unsigned long flags;
526         struct ata_queued_cmd *qc;
527         enum blk_eh_timer_return ret;
528
529         DPRINTK("ENTER\n");
530
531         if (ap->ops->error_handler) {
532                 ret = BLK_EH_NOT_HANDLED;
533                 goto out;
534         }
535
536         ret = BLK_EH_HANDLED;
537         spin_lock_irqsave(ap->lock, flags);
538         qc = ata_qc_from_tag(ap, ap->link.active_tag);
539         if (qc) {
540                 WARN_ON(qc->scsicmd != cmd);
541                 qc->flags |= ATA_QCFLAG_EH_SCHEDULED;
542                 qc->err_mask |= AC_ERR_TIMEOUT;
543                 ret = BLK_EH_NOT_HANDLED;
544         }
545         spin_unlock_irqrestore(ap->lock, flags);
546
547  out:
548         DPRINTK("EXIT, ret=%d\n", ret);
549         return ret;
550 }
551
552 static void ata_eh_unload(struct ata_port *ap)
553 {
554         struct ata_link *link;
555         struct ata_device *dev;
556         unsigned long flags;
557
558         /* Restore SControl IPM and SPD for the next driver and
559          * disable attached devices.
560          */
561         ata_for_each_link(link, ap, PMP_FIRST) {
562                 sata_scr_write(link, SCR_CONTROL, link->saved_scontrol & 0xff0);
563                 ata_for_each_dev(dev, link, ALL)
564                         ata_dev_disable(dev);
565         }
566
567         /* freeze and set UNLOADED */
568         spin_lock_irqsave(ap->lock, flags);
569
570         ata_port_freeze(ap);                    /* won't be thawed */
571         ap->pflags &= ~ATA_PFLAG_EH_PENDING;    /* clear pending from freeze */
572         ap->pflags |= ATA_PFLAG_UNLOADED;
573
574         spin_unlock_irqrestore(ap->lock, flags);
575 }
576
577 /**
578  *      ata_scsi_error - SCSI layer error handler callback
579  *      @host: SCSI host on which error occurred
580  *
581  *      Handles SCSI-layer-thrown error events.
582  *
583  *      LOCKING:
584  *      Inherited from SCSI layer (none, can sleep)
585  *
586  *      RETURNS:
587  *      Zero.
588  */
589 void ata_scsi_error(struct Scsi_Host *host)
590 {
591         struct ata_port *ap = ata_shost_to_port(host);
592         unsigned long flags;
593         LIST_HEAD(eh_work_q);
594
595         DPRINTK("ENTER\n");
596
597         spin_lock_irqsave(host->host_lock, flags);
598         list_splice_init(&host->eh_cmd_q, &eh_work_q);
599         spin_unlock_irqrestore(host->host_lock, flags);
600
601         ata_scsi_cmd_error_handler(host, ap, &eh_work_q);
602
603         /* If we timed raced normal completion and there is nothing to
604            recover nr_timedout == 0 why exactly are we doing error recovery ? */
605         ata_scsi_port_error_handler(host, ap);
606
607         /* finish or retry handled scmd's and clean up */
608         WARN_ON(host->host_failed || !list_empty(&eh_work_q));
609
610         DPRINTK("EXIT\n");
611 }
612
613 /**
614  * ata_scsi_cmd_error_handler - error callback for a list of commands
615  * @host:       scsi host containing the port
616  * @ap:         ATA port within the host
617  * @eh_work_q:  list of commands to process
618  *
619  * process the given list of commands and return those finished to the
620  * ap->eh_done_q.  This function is the first part of the libata error
621  * handler which processes a given list of failed commands.
622  */
623 void ata_scsi_cmd_error_handler(struct Scsi_Host *host, struct ata_port *ap,
624                                 struct list_head *eh_work_q)
625 {
626         int i;
627         unsigned long flags;
628
629         /* make sure sff pio task is not running */
630         ata_sff_flush_pio_task(ap);
631
632         /* synchronize with host lock and sort out timeouts */
633
634         /* For new EH, all qcs are finished in one of three ways -
635          * normal completion, error completion, and SCSI timeout.
636          * Both completions can race against SCSI timeout.  When normal
637          * completion wins, the qc never reaches EH.  When error
638          * completion wins, the qc has ATA_QCFLAG_FAILED set.
639          *
640          * When SCSI timeout wins, things are a bit more complex.
641          * Normal or error completion can occur after the timeout but
642          * before this point.  In such cases, both types of
643          * completions are honored.  A scmd is determined to have
644          * timed out iff its associated qc is active and not failed.
645          */
646         if (ap->ops->error_handler) {
647                 struct scsi_cmnd *scmd, *tmp;
648                 int nr_timedout = 0;
649
650                 spin_lock_irqsave(ap->lock, flags);
651
652                 /* This must occur under the ap->lock as we don't want
653                    a polled recovery to race the real interrupt handler
654
655                    The lost_interrupt handler checks for any completed but
656                    non-notified command and completes much like an IRQ handler.
657
658                    We then fall into the error recovery code which will treat
659                    this as if normal completion won the race */
660
661                 if (ap->ops->lost_interrupt)
662                         ap->ops->lost_interrupt(ap);
663
664                 list_for_each_entry_safe(scmd, tmp, eh_work_q, eh_entry) {
665                         struct ata_queued_cmd *qc;
666
667                         for (i = 0; i < ATA_MAX_QUEUE; i++) {
668                                 qc = __ata_qc_from_tag(ap, i);
669                                 if (qc->flags & ATA_QCFLAG_ACTIVE &&
670                                     qc->scsicmd == scmd)
671                                         break;
672                         }
673
674                         if (i < ATA_MAX_QUEUE) {
675                                 /* the scmd has an associated qc */
676                                 if (!(qc->flags & ATA_QCFLAG_FAILED)) {
677                                         /* which hasn't failed yet, timeout */
678                                         qc->err_mask |= AC_ERR_TIMEOUT;
679                                         qc->flags |= ATA_QCFLAG_FAILED;
680                                         nr_timedout++;
681                                 }
682                         } else {
683                                 /* Normal completion occurred after
684                                  * SCSI timeout but before this point.
685                                  * Successfully complete it.
686                                  */
687                                 scmd->retries = scmd->allowed;
688                                 scsi_eh_finish_cmd(scmd, &ap->eh_done_q);
689                         }
690                 }
691
692                 /* If we have timed out qcs.  They belong to EH from
693                  * this point but the state of the controller is
694                  * unknown.  Freeze the port to make sure the IRQ
695                  * handler doesn't diddle with those qcs.  This must
696                  * be done atomically w.r.t. setting QCFLAG_FAILED.
697                  */
698                 if (nr_timedout)
699                         __ata_port_freeze(ap);
700
701                 spin_unlock_irqrestore(ap->lock, flags);
702
703                 /* initialize eh_tries */
704                 ap->eh_tries = ATA_EH_MAX_TRIES;
705         } else
706                 spin_unlock_wait(ap->lock);
707
708 }
709 EXPORT_SYMBOL(ata_scsi_cmd_error_handler);
710
711 /**
712  * ata_scsi_port_error_handler - recover the port after the commands
713  * @host:       SCSI host containing the port
714  * @ap:         the ATA port
715  *
716  * Handle the recovery of the port @ap after all the commands
717  * have been recovered.
718  */
719 void ata_scsi_port_error_handler(struct Scsi_Host *host, struct ata_port *ap)
720 {
721         unsigned long flags;
722
723         /* invoke error handler */
724         if (ap->ops->error_handler) {
725                 struct ata_link *link;
726
727                 /* acquire EH ownership */
728                 ata_eh_acquire(ap);
729  repeat:
730                 /* kill fast drain timer */
731                 del_timer_sync(&ap->fastdrain_timer);
732
733                 /* process port resume request */
734                 ata_eh_handle_port_resume(ap);
735
736                 /* fetch & clear EH info */
737                 spin_lock_irqsave(ap->lock, flags);
738
739                 ata_for_each_link(link, ap, HOST_FIRST) {
740                         struct ata_eh_context *ehc = &link->eh_context;
741                         struct ata_device *dev;
742
743                         memset(&link->eh_context, 0, sizeof(link->eh_context));
744                         link->eh_context.i = link->eh_info;
745                         memset(&link->eh_info, 0, sizeof(link->eh_info));
746
747                         ata_for_each_dev(dev, link, ENABLED) {
748                                 int devno = dev->devno;
749
750                                 ehc->saved_xfer_mode[devno] = dev->xfer_mode;
751                                 if (ata_ncq_enabled(dev))
752                                         ehc->saved_ncq_enabled |= 1 << devno;
753                         }
754                 }
755
756                 ap->pflags |= ATA_PFLAG_EH_IN_PROGRESS;
757                 ap->pflags &= ~ATA_PFLAG_EH_PENDING;
758                 ap->excl_link = NULL;   /* don't maintain exclusion over EH */
759
760                 spin_unlock_irqrestore(ap->lock, flags);
761
762                 /* invoke EH, skip if unloading or suspended */
763                 if (!(ap->pflags & (ATA_PFLAG_UNLOADING | ATA_PFLAG_SUSPENDED)))
764                         ap->ops->error_handler(ap);
765                 else {
766                         /* if unloading, commence suicide */
767                         if ((ap->pflags & ATA_PFLAG_UNLOADING) &&
768                             !(ap->pflags & ATA_PFLAG_UNLOADED))
769                                 ata_eh_unload(ap);
770                         ata_eh_finish(ap);
771                 }
772
773                 /* process port suspend request */
774                 ata_eh_handle_port_suspend(ap);
775
776                 /* Exception might have happened after ->error_handler
777                  * recovered the port but before this point.  Repeat
778                  * EH in such case.
779                  */
780                 spin_lock_irqsave(ap->lock, flags);
781
782                 if (ap->pflags & ATA_PFLAG_EH_PENDING) {
783                         if (--ap->eh_tries) {
784                                 spin_unlock_irqrestore(ap->lock, flags);
785                                 goto repeat;
786                         }
787                         ata_port_err(ap,
788                                      "EH pending after %d tries, giving up\n",
789                                      ATA_EH_MAX_TRIES);
790                         ap->pflags &= ~ATA_PFLAG_EH_PENDING;
791                 }
792
793                 /* this run is complete, make sure EH info is clear */
794                 ata_for_each_link(link, ap, HOST_FIRST)
795                         memset(&link->eh_info, 0, sizeof(link->eh_info));
796
797                 /* end eh (clear host_eh_scheduled) while holding
798                  * ap->lock such that if exception occurs after this
799                  * point but before EH completion, SCSI midlayer will
800                  * re-initiate EH.
801                  */
802                 ap->ops->end_eh(ap);
803
804                 spin_unlock_irqrestore(ap->lock, flags);
805                 ata_eh_release(ap);
806         } else {
807                 WARN_ON(ata_qc_from_tag(ap, ap->link.active_tag) == NULL);
808                 ap->ops->eng_timeout(ap);
809         }
810
811         scsi_eh_flush_done_q(&ap->eh_done_q);
812
813         /* clean up */
814         spin_lock_irqsave(ap->lock, flags);
815
816         if (ap->pflags & ATA_PFLAG_LOADING)
817                 ap->pflags &= ~ATA_PFLAG_LOADING;
818         else if (ap->pflags & ATA_PFLAG_SCSI_HOTPLUG)
819                 schedule_delayed_work(&ap->hotplug_task, 0);
820
821         if (ap->pflags & ATA_PFLAG_RECOVERED)
822                 ata_port_info(ap, "EH complete\n");
823
824         ap->pflags &= ~(ATA_PFLAG_SCSI_HOTPLUG | ATA_PFLAG_RECOVERED);
825
826         /* tell wait_eh that we're done */
827         ap->pflags &= ~ATA_PFLAG_EH_IN_PROGRESS;
828         wake_up_all(&ap->eh_wait_q);
829
830         spin_unlock_irqrestore(ap->lock, flags);
831 }
832 EXPORT_SYMBOL_GPL(ata_scsi_port_error_handler);
833
834 /**
835  *      ata_port_wait_eh - Wait for the currently pending EH to complete
836  *      @ap: Port to wait EH for
837  *
838  *      Wait until the currently pending EH is complete.
839  *
840  *      LOCKING:
841  *      Kernel thread context (may sleep).
842  */
843 void ata_port_wait_eh(struct ata_port *ap)
844 {
845         unsigned long flags;
846         DEFINE_WAIT(wait);
847
848  retry:
849         spin_lock_irqsave(ap->lock, flags);
850
851         while (ap->pflags & (ATA_PFLAG_EH_PENDING | ATA_PFLAG_EH_IN_PROGRESS)) {
852                 prepare_to_wait(&ap->eh_wait_q, &wait, TASK_UNINTERRUPTIBLE);
853                 spin_unlock_irqrestore(ap->lock, flags);
854                 schedule();
855                 spin_lock_irqsave(ap->lock, flags);
856         }
857         finish_wait(&ap->eh_wait_q, &wait);
858
859         spin_unlock_irqrestore(ap->lock, flags);
860
861         /* make sure SCSI EH is complete */
862         if (scsi_host_in_recovery(ap->scsi_host)) {
863                 ata_msleep(ap, 10);
864                 goto retry;
865         }
866 }
867 EXPORT_SYMBOL_GPL(ata_port_wait_eh);
868
869 static int ata_eh_nr_in_flight(struct ata_port *ap)
870 {
871         unsigned int tag;
872         int nr = 0;
873
874         /* count only non-internal commands */
875         for (tag = 0; tag < ATA_MAX_QUEUE - 1; tag++)
876                 if (ata_qc_from_tag(ap, tag))
877                         nr++;
878
879         return nr;
880 }
881
882 void ata_eh_fastdrain_timerfn(unsigned long arg)
883 {
884         struct ata_port *ap = (void *)arg;
885         unsigned long flags;
886         int cnt;
887
888         spin_lock_irqsave(ap->lock, flags);
889
890         cnt = ata_eh_nr_in_flight(ap);
891
892         /* are we done? */
893         if (!cnt)
894                 goto out_unlock;
895
896         if (cnt == ap->fastdrain_cnt) {
897                 unsigned int tag;
898
899                 /* No progress during the last interval, tag all
900                  * in-flight qcs as timed out and freeze the port.
901                  */
902                 for (tag = 0; tag < ATA_MAX_QUEUE - 1; tag++) {
903                         struct ata_queued_cmd *qc = ata_qc_from_tag(ap, tag);
904                         if (qc)
905                                 qc->err_mask |= AC_ERR_TIMEOUT;
906                 }
907
908                 ata_port_freeze(ap);
909         } else {
910                 /* some qcs have finished, give it another chance */
911                 ap->fastdrain_cnt = cnt;
912                 ap->fastdrain_timer.expires =
913                         ata_deadline(jiffies, ATA_EH_FASTDRAIN_INTERVAL);
914                 add_timer(&ap->fastdrain_timer);
915         }
916
917  out_unlock:
918         spin_unlock_irqrestore(ap->lock, flags);
919 }
920
921 /**
922  *      ata_eh_set_pending - set ATA_PFLAG_EH_PENDING and activate fast drain
923  *      @ap: target ATA port
924  *      @fastdrain: activate fast drain
925  *
926  *      Set ATA_PFLAG_EH_PENDING and activate fast drain if @fastdrain
927  *      is non-zero and EH wasn't pending before.  Fast drain ensures
928  *      that EH kicks in in timely manner.
929  *
930  *      LOCKING:
931  *      spin_lock_irqsave(host lock)
932  */
933 static void ata_eh_set_pending(struct ata_port *ap, int fastdrain)
934 {
935         int cnt;
936
937         /* already scheduled? */
938         if (ap->pflags & ATA_PFLAG_EH_PENDING)
939                 return;
940
941         ap->pflags |= ATA_PFLAG_EH_PENDING;
942
943         if (!fastdrain)
944                 return;
945
946         /* do we have in-flight qcs? */
947         cnt = ata_eh_nr_in_flight(ap);
948         if (!cnt)
949                 return;
950
951         /* activate fast drain */
952         ap->fastdrain_cnt = cnt;
953         ap->fastdrain_timer.expires =
954                 ata_deadline(jiffies, ATA_EH_FASTDRAIN_INTERVAL);
955         add_timer(&ap->fastdrain_timer);
956 }
957
958 /**
959  *      ata_qc_schedule_eh - schedule qc for error handling
960  *      @qc: command to schedule error handling for
961  *
962  *      Schedule error handling for @qc.  EH will kick in as soon as
963  *      other commands are drained.
964  *
965  *      LOCKING:
966  *      spin_lock_irqsave(host lock)
967  */
968 void ata_qc_schedule_eh(struct ata_queued_cmd *qc)
969 {
970         struct ata_port *ap = qc->ap;
971         struct request_queue *q = qc->scsicmd->device->request_queue;
972         unsigned long flags;
973
974         WARN_ON(!ap->ops->error_handler);
975
976         qc->flags |= ATA_QCFLAG_FAILED;
977         ata_eh_set_pending(ap, 1);
978
979         /* The following will fail if timeout has already expired.
980          * ata_scsi_error() takes care of such scmds on EH entry.
981          * Note that ATA_QCFLAG_FAILED is unconditionally set after
982          * this function completes.
983          */
984         spin_lock_irqsave(q->queue_lock, flags);
985         blk_abort_request(qc->scsicmd->request);
986         spin_unlock_irqrestore(q->queue_lock, flags);
987 }
988
989 /**
990  * ata_std_sched_eh - non-libsas ata_ports issue eh with this common routine
991  * @ap: ATA port to schedule EH for
992  *
993  *      LOCKING: inherited from ata_port_schedule_eh
994  *      spin_lock_irqsave(host lock)
995  */
996 void ata_std_sched_eh(struct ata_port *ap)
997 {
998         WARN_ON(!ap->ops->error_handler);
999
1000         if (ap->pflags & ATA_PFLAG_INITIALIZING)
1001                 return;
1002
1003         ata_eh_set_pending(ap, 1);
1004         scsi_schedule_eh(ap->scsi_host);
1005
1006         DPRINTK("port EH scheduled\n");
1007 }
1008 EXPORT_SYMBOL_GPL(ata_std_sched_eh);
1009
1010 /**
1011  * ata_std_end_eh - non-libsas ata_ports complete eh with this common routine
1012  * @ap: ATA port to end EH for
1013  *
1014  * In the libata object model there is a 1:1 mapping of ata_port to
1015  * shost, so host fields can be directly manipulated under ap->lock, in
1016  * the libsas case we need to hold a lock at the ha->level to coordinate
1017  * these events.
1018  *
1019  *      LOCKING:
1020  *      spin_lock_irqsave(host lock)
1021  */
1022 void ata_std_end_eh(struct ata_port *ap)
1023 {
1024         struct Scsi_Host *host = ap->scsi_host;
1025
1026         host->host_eh_scheduled = 0;
1027 }
1028 EXPORT_SYMBOL(ata_std_end_eh);
1029
1030
1031 /**
1032  *      ata_port_schedule_eh - schedule error handling without a qc
1033  *      @ap: ATA port to schedule EH for
1034  *
1035  *      Schedule error handling for @ap.  EH will kick in as soon as
1036  *      all commands are drained.
1037  *
1038  *      LOCKING:
1039  *      spin_lock_irqsave(host lock)
1040  */
1041 void ata_port_schedule_eh(struct ata_port *ap)
1042 {
1043         /* see: ata_std_sched_eh, unless you know better */
1044         ap->ops->sched_eh(ap);
1045 }
1046
1047 static int ata_do_link_abort(struct ata_port *ap, struct ata_link *link)
1048 {
1049         int tag, nr_aborted = 0;
1050
1051         WARN_ON(!ap->ops->error_handler);
1052
1053         /* we're gonna abort all commands, no need for fast drain */
1054         ata_eh_set_pending(ap, 0);
1055
1056         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
1057                 struct ata_queued_cmd *qc = ata_qc_from_tag(ap, tag);
1058
1059                 if (qc && (!link || qc->dev->link == link)) {
1060                         qc->flags |= ATA_QCFLAG_FAILED;
1061                         ata_qc_complete(qc);
1062                         nr_aborted++;
1063                 }
1064         }
1065
1066         if (!nr_aborted)
1067                 ata_port_schedule_eh(ap);
1068
1069         return nr_aborted;
1070 }
1071
1072 /**
1073  *      ata_link_abort - abort all qc's on the link
1074  *      @link: ATA link to abort qc's for
1075  *
1076  *      Abort all active qc's active on @link and schedule EH.
1077  *
1078  *      LOCKING:
1079  *      spin_lock_irqsave(host lock)
1080  *
1081  *      RETURNS:
1082  *      Number of aborted qc's.
1083  */
1084 int ata_link_abort(struct ata_link *link)
1085 {
1086         return ata_do_link_abort(link->ap, link);
1087 }
1088
1089 /**
1090  *      ata_port_abort - abort all qc's on the port
1091  *      @ap: ATA port to abort qc's for
1092  *
1093  *      Abort all active qc's of @ap and schedule EH.
1094  *
1095  *      LOCKING:
1096  *      spin_lock_irqsave(host_set lock)
1097  *
1098  *      RETURNS:
1099  *      Number of aborted qc's.
1100  */
1101 int ata_port_abort(struct ata_port *ap)
1102 {
1103         return ata_do_link_abort(ap, NULL);
1104 }
1105
1106 /**
1107  *      __ata_port_freeze - freeze port
1108  *      @ap: ATA port to freeze
1109  *
1110  *      This function is called when HSM violation or some other
1111  *      condition disrupts normal operation of the port.  Frozen port
1112  *      is not allowed to perform any operation until the port is
1113  *      thawed, which usually follows a successful reset.
1114  *
1115  *      ap->ops->freeze() callback can be used for freezing the port
1116  *      hardware-wise (e.g. mask interrupt and stop DMA engine).  If a
1117  *      port cannot be frozen hardware-wise, the interrupt handler
1118  *      must ack and clear interrupts unconditionally while the port
1119  *      is frozen.
1120  *
1121  *      LOCKING:
1122  *      spin_lock_irqsave(host lock)
1123  */
1124 static void __ata_port_freeze(struct ata_port *ap)
1125 {
1126         WARN_ON(!ap->ops->error_handler);
1127
1128         if (ap->ops->freeze)
1129                 ap->ops->freeze(ap);
1130
1131         ap->pflags |= ATA_PFLAG_FROZEN;
1132
1133         DPRINTK("ata%u port frozen\n", ap->print_id);
1134 }
1135
1136 /**
1137  *      ata_port_freeze - abort & freeze port
1138  *      @ap: ATA port to freeze
1139  *
1140  *      Abort and freeze @ap.  The freeze operation must be called
1141  *      first, because some hardware requires special operations
1142  *      before the taskfile registers are accessible.
1143  *
1144  *      LOCKING:
1145  *      spin_lock_irqsave(host lock)
1146  *
1147  *      RETURNS:
1148  *      Number of aborted commands.
1149  */
1150 int ata_port_freeze(struct ata_port *ap)
1151 {
1152         int nr_aborted;
1153
1154         WARN_ON(!ap->ops->error_handler);
1155
1156         __ata_port_freeze(ap);
1157         nr_aborted = ata_port_abort(ap);
1158
1159         return nr_aborted;
1160 }
1161
1162 /**
1163  *      sata_async_notification - SATA async notification handler
1164  *      @ap: ATA port where async notification is received
1165  *
1166  *      Handler to be called when async notification via SDB FIS is
1167  *      received.  This function schedules EH if necessary.
1168  *
1169  *      LOCKING:
1170  *      spin_lock_irqsave(host lock)
1171  *
1172  *      RETURNS:
1173  *      1 if EH is scheduled, 0 otherwise.
1174  */
1175 int sata_async_notification(struct ata_port *ap)
1176 {
1177         u32 sntf;
1178         int rc;
1179
1180         if (!(ap->flags & ATA_FLAG_AN))
1181                 return 0;
1182
1183         rc = sata_scr_read(&ap->link, SCR_NOTIFICATION, &sntf);
1184         if (rc == 0)
1185                 sata_scr_write(&ap->link, SCR_NOTIFICATION, sntf);
1186
1187         if (!sata_pmp_attached(ap) || rc) {
1188                 /* PMP is not attached or SNTF is not available */
1189                 if (!sata_pmp_attached(ap)) {
1190                         /* PMP is not attached.  Check whether ATAPI
1191                          * AN is configured.  If so, notify media
1192                          * change.
1193                          */
1194                         struct ata_device *dev = ap->link.device;
1195
1196                         if ((dev->class == ATA_DEV_ATAPI) &&
1197                             (dev->flags & ATA_DFLAG_AN))
1198                                 ata_scsi_media_change_notify(dev);
1199                         return 0;
1200                 } else {
1201                         /* PMP is attached but SNTF is not available.
1202                          * ATAPI async media change notification is
1203                          * not used.  The PMP must be reporting PHY
1204                          * status change, schedule EH.
1205                          */
1206                         ata_port_schedule_eh(ap);
1207                         return 1;
1208                 }
1209         } else {
1210                 /* PMP is attached and SNTF is available */
1211                 struct ata_link *link;
1212
1213                 /* check and notify ATAPI AN */
1214                 ata_for_each_link(link, ap, EDGE) {
1215                         if (!(sntf & (1 << link->pmp)))
1216                                 continue;
1217
1218                         if ((link->device->class == ATA_DEV_ATAPI) &&
1219                             (link->device->flags & ATA_DFLAG_AN))
1220                                 ata_scsi_media_change_notify(link->device);
1221                 }
1222
1223                 /* If PMP is reporting that PHY status of some
1224                  * downstream ports has changed, schedule EH.
1225                  */
1226                 if (sntf & (1 << SATA_PMP_CTRL_PORT)) {
1227                         ata_port_schedule_eh(ap);
1228                         return 1;
1229                 }
1230
1231                 return 0;
1232         }
1233 }
1234
1235 /**
1236  *      ata_eh_freeze_port - EH helper to freeze port
1237  *      @ap: ATA port to freeze
1238  *
1239  *      Freeze @ap.
1240  *
1241  *      LOCKING:
1242  *      None.
1243  */
1244 void ata_eh_freeze_port(struct ata_port *ap)
1245 {
1246         unsigned long flags;
1247
1248         if (!ap->ops->error_handler)
1249                 return;
1250
1251         spin_lock_irqsave(ap->lock, flags);
1252         __ata_port_freeze(ap);
1253         spin_unlock_irqrestore(ap->lock, flags);
1254 }
1255
1256 /**
1257  *      ata_port_thaw_port - EH helper to thaw port
1258  *      @ap: ATA port to thaw
1259  *
1260  *      Thaw frozen port @ap.
1261  *
1262  *      LOCKING:
1263  *      None.
1264  */
1265 void ata_eh_thaw_port(struct ata_port *ap)
1266 {
1267         unsigned long flags;
1268
1269         if (!ap->ops->error_handler)
1270                 return;
1271
1272         spin_lock_irqsave(ap->lock, flags);
1273
1274         ap->pflags &= ~ATA_PFLAG_FROZEN;
1275
1276         if (ap->ops->thaw)
1277                 ap->ops->thaw(ap);
1278
1279         spin_unlock_irqrestore(ap->lock, flags);
1280
1281         DPRINTK("ata%u port thawed\n", ap->print_id);
1282 }
1283
1284 static void ata_eh_scsidone(struct scsi_cmnd *scmd)
1285 {
1286         /* nada */
1287 }
1288
1289 static void __ata_eh_qc_complete(struct ata_queued_cmd *qc)
1290 {
1291         struct ata_port *ap = qc->ap;
1292         struct scsi_cmnd *scmd = qc->scsicmd;
1293         unsigned long flags;
1294
1295         spin_lock_irqsave(ap->lock, flags);
1296         qc->scsidone = ata_eh_scsidone;
1297         __ata_qc_complete(qc);
1298         WARN_ON(ata_tag_valid(qc->tag));
1299         spin_unlock_irqrestore(ap->lock, flags);
1300
1301         scsi_eh_finish_cmd(scmd, &ap->eh_done_q);
1302 }
1303
1304 /**
1305  *      ata_eh_qc_complete - Complete an active ATA command from EH
1306  *      @qc: Command to complete
1307  *
1308  *      Indicate to the mid and upper layers that an ATA command has
1309  *      completed.  To be used from EH.
1310  */
1311 void ata_eh_qc_complete(struct ata_queued_cmd *qc)
1312 {
1313         struct scsi_cmnd *scmd = qc->scsicmd;
1314         scmd->retries = scmd->allowed;
1315         __ata_eh_qc_complete(qc);
1316 }
1317
1318 /**
1319  *      ata_eh_qc_retry - Tell midlayer to retry an ATA command after EH
1320  *      @qc: Command to retry
1321  *
1322  *      Indicate to the mid and upper layers that an ATA command
1323  *      should be retried.  To be used from EH.
1324  *
1325  *      SCSI midlayer limits the number of retries to scmd->allowed.
1326  *      scmd->allowed is incremented for commands which get retried
1327  *      due to unrelated failures (qc->err_mask is zero).
1328  */
1329 void ata_eh_qc_retry(struct ata_queued_cmd *qc)
1330 {
1331         struct scsi_cmnd *scmd = qc->scsicmd;
1332         if (!qc->err_mask)
1333                 scmd->allowed++;
1334         __ata_eh_qc_complete(qc);
1335 }
1336
1337 /**
1338  *      ata_dev_disable - disable ATA device
1339  *      @dev: ATA device to disable
1340  *
1341  *      Disable @dev.
1342  *
1343  *      Locking:
1344  *      EH context.
1345  */
1346 void ata_dev_disable(struct ata_device *dev)
1347 {
1348         if (!ata_dev_enabled(dev))
1349                 return;
1350
1351         if (ata_msg_drv(dev->link->ap))
1352                 ata_dev_warn(dev, "disabled\n");
1353         ata_acpi_on_disable(dev);
1354         ata_down_xfermask_limit(dev, ATA_DNXFER_FORCE_PIO0 | ATA_DNXFER_QUIET);
1355         dev->class++;
1356
1357         /* From now till the next successful probe, ering is used to
1358          * track probe failures.  Clear accumulated device error info.
1359          */
1360         ata_ering_clear(&dev->ering);
1361 }
1362
1363 /**
1364  *      ata_eh_detach_dev - detach ATA device
1365  *      @dev: ATA device to detach
1366  *
1367  *      Detach @dev.
1368  *
1369  *      LOCKING:
1370  *      None.
1371  */
1372 void ata_eh_detach_dev(struct ata_device *dev)
1373 {
1374         struct ata_link *link = dev->link;
1375         struct ata_port *ap = link->ap;
1376         struct ata_eh_context *ehc = &link->eh_context;
1377         unsigned long flags;
1378
1379         ata_dev_disable(dev);
1380
1381         spin_lock_irqsave(ap->lock, flags);
1382
1383         dev->flags &= ~ATA_DFLAG_DETACH;
1384
1385         if (ata_scsi_offline_dev(dev)) {
1386                 dev->flags |= ATA_DFLAG_DETACHED;
1387                 ap->pflags |= ATA_PFLAG_SCSI_HOTPLUG;
1388         }
1389
1390         /* clear per-dev EH info */
1391         ata_eh_clear_action(link, dev, &link->eh_info, ATA_EH_PERDEV_MASK);
1392         ata_eh_clear_action(link, dev, &link->eh_context.i, ATA_EH_PERDEV_MASK);
1393         ehc->saved_xfer_mode[dev->devno] = 0;
1394         ehc->saved_ncq_enabled &= ~(1 << dev->devno);
1395
1396         spin_unlock_irqrestore(ap->lock, flags);
1397 }
1398
1399 /**
1400  *      ata_eh_about_to_do - about to perform eh_action
1401  *      @link: target ATA link
1402  *      @dev: target ATA dev for per-dev action (can be NULL)
1403  *      @action: action about to be performed
1404  *
1405  *      Called just before performing EH actions to clear related bits
1406  *      in @link->eh_info such that eh actions are not unnecessarily
1407  *      repeated.
1408  *
1409  *      LOCKING:
1410  *      None.
1411  */
1412 void ata_eh_about_to_do(struct ata_link *link, struct ata_device *dev,
1413                         unsigned int action)
1414 {
1415         struct ata_port *ap = link->ap;
1416         struct ata_eh_info *ehi = &link->eh_info;
1417         struct ata_eh_context *ehc = &link->eh_context;
1418         unsigned long flags;
1419
1420         spin_lock_irqsave(ap->lock, flags);
1421
1422         ata_eh_clear_action(link, dev, ehi, action);
1423
1424         /* About to take EH action, set RECOVERED.  Ignore actions on
1425          * slave links as master will do them again.
1426          */
1427         if (!(ehc->i.flags & ATA_EHI_QUIET) && link != ap->slave_link)
1428                 ap->pflags |= ATA_PFLAG_RECOVERED;
1429
1430         spin_unlock_irqrestore(ap->lock, flags);
1431 }
1432
1433 /**
1434  *      ata_eh_done - EH action complete
1435 *       @ap: target ATA port
1436  *      @dev: target ATA dev for per-dev action (can be NULL)
1437  *      @action: action just completed
1438  *
1439  *      Called right after performing EH actions to clear related bits
1440  *      in @link->eh_context.
1441  *
1442  *      LOCKING:
1443  *      None.
1444  */
1445 void ata_eh_done(struct ata_link *link, struct ata_device *dev,
1446                  unsigned int action)
1447 {
1448         struct ata_eh_context *ehc = &link->eh_context;
1449
1450         ata_eh_clear_action(link, dev, &ehc->i, action);
1451 }
1452
1453 /**
1454  *      ata_err_string - convert err_mask to descriptive string
1455  *      @err_mask: error mask to convert to string
1456  *
1457  *      Convert @err_mask to descriptive string.  Errors are
1458  *      prioritized according to severity and only the most severe
1459  *      error is reported.
1460  *
1461  *      LOCKING:
1462  *      None.
1463  *
1464  *      RETURNS:
1465  *      Descriptive string for @err_mask
1466  */
1467 static const char *ata_err_string(unsigned int err_mask)
1468 {
1469         if (err_mask & AC_ERR_HOST_BUS)
1470                 return "host bus error";
1471         if (err_mask & AC_ERR_ATA_BUS)
1472                 return "ATA bus error";
1473         if (err_mask & AC_ERR_TIMEOUT)
1474                 return "timeout";
1475         if (err_mask & AC_ERR_HSM)
1476                 return "HSM violation";
1477         if (err_mask & AC_ERR_SYSTEM)
1478                 return "internal error";
1479         if (err_mask & AC_ERR_MEDIA)
1480                 return "media error";
1481         if (err_mask & AC_ERR_INVALID)
1482                 return "invalid argument";
1483         if (err_mask & AC_ERR_DEV)
1484                 return "device error";
1485         return "unknown error";
1486 }
1487
1488 /**
1489  *      ata_read_log_page - read a specific log page
1490  *      @dev: target device
1491  *      @log: log to read
1492  *      @page: page to read
1493  *      @buf: buffer to store read page
1494  *      @sectors: number of sectors to read
1495  *
1496  *      Read log page using READ_LOG_EXT command.
1497  *
1498  *      LOCKING:
1499  *      Kernel thread context (may sleep).
1500  *
1501  *      RETURNS:
1502  *      0 on success, AC_ERR_* mask otherwise.
1503  */
1504 unsigned int ata_read_log_page(struct ata_device *dev, u8 log,
1505                                u8 page, void *buf, unsigned int sectors)
1506 {
1507         struct ata_taskfile tf;
1508         unsigned int err_mask;
1509
1510         DPRINTK("read log page - log 0x%x, page 0x%x\n", log, page);
1511
1512         ata_tf_init(dev, &tf);
1513         tf.command = ATA_CMD_READ_LOG_EXT;
1514         tf.lbal = log;
1515         tf.lbam = page;
1516         tf.nsect = sectors;
1517         tf.hob_nsect = sectors >> 8;
1518         tf.flags |= ATA_TFLAG_ISADDR | ATA_TFLAG_LBA48 | ATA_TFLAG_DEVICE;
1519         tf.protocol = ATA_PROT_PIO;
1520
1521         err_mask = ata_exec_internal(dev, &tf, NULL, DMA_FROM_DEVICE,
1522                                      buf, sectors * ATA_SECT_SIZE, 0);
1523
1524         DPRINTK("EXIT, err_mask=%x\n", err_mask);
1525         return err_mask;
1526 }
1527
1528 /**
1529  *      ata_eh_read_log_10h - Read log page 10h for NCQ error details
1530  *      @dev: Device to read log page 10h from
1531  *      @tag: Resulting tag of the failed command
1532  *      @tf: Resulting taskfile registers of the failed command
1533  *
1534  *      Read log page 10h to obtain NCQ error details and clear error
1535  *      condition.
1536  *
1537  *      LOCKING:
1538  *      Kernel thread context (may sleep).
1539  *
1540  *      RETURNS:
1541  *      0 on success, -errno otherwise.
1542  */
1543 static int ata_eh_read_log_10h(struct ata_device *dev,
1544                                int *tag, struct ata_taskfile *tf)
1545 {
1546         u8 *buf = dev->link->ap->sector_buf;
1547         unsigned int err_mask;
1548         u8 csum;
1549         int i;
1550
1551         err_mask = ata_read_log_page(dev, ATA_LOG_SATA_NCQ, 0, buf, 1);
1552         if (err_mask)
1553                 return -EIO;
1554
1555         csum = 0;
1556         for (i = 0; i < ATA_SECT_SIZE; i++)
1557                 csum += buf[i];
1558         if (csum)
1559                 ata_dev_warn(dev, "invalid checksum 0x%x on log page 10h\n",
1560                              csum);
1561
1562         if (buf[0] & 0x80)
1563                 return -ENOENT;
1564
1565         *tag = buf[0] & 0x1f;
1566
1567         tf->command = buf[2];
1568         tf->feature = buf[3];
1569         tf->lbal = buf[4];
1570         tf->lbam = buf[5];
1571         tf->lbah = buf[6];
1572         tf->device = buf[7];
1573         tf->hob_lbal = buf[8];
1574         tf->hob_lbam = buf[9];
1575         tf->hob_lbah = buf[10];
1576         tf->nsect = buf[12];
1577         tf->hob_nsect = buf[13];
1578
1579         return 0;
1580 }
1581
1582 /**
1583  *      atapi_eh_tur - perform ATAPI TEST_UNIT_READY
1584  *      @dev: target ATAPI device
1585  *      @r_sense_key: out parameter for sense_key
1586  *
1587  *      Perform ATAPI TEST_UNIT_READY.
1588  *
1589  *      LOCKING:
1590  *      EH context (may sleep).
1591  *
1592  *      RETURNS:
1593  *      0 on success, AC_ERR_* mask on failure.
1594  */
1595 unsigned int atapi_eh_tur(struct ata_device *dev, u8 *r_sense_key)
1596 {
1597         u8 cdb[ATAPI_CDB_LEN] = { TEST_UNIT_READY, 0, 0, 0, 0, 0 };
1598         struct ata_taskfile tf;
1599         unsigned int err_mask;
1600
1601         ata_tf_init(dev, &tf);
1602
1603         tf.flags |= ATA_TFLAG_ISADDR | ATA_TFLAG_DEVICE;
1604         tf.command = ATA_CMD_PACKET;
1605         tf.protocol = ATAPI_PROT_NODATA;
1606
1607         err_mask = ata_exec_internal(dev, &tf, cdb, DMA_NONE, NULL, 0, 0);
1608         if (err_mask == AC_ERR_DEV)
1609                 *r_sense_key = tf.feature >> 4;
1610         return err_mask;
1611 }
1612
1613 /**
1614  *      atapi_eh_request_sense - perform ATAPI REQUEST_SENSE
1615  *      @dev: device to perform REQUEST_SENSE to
1616  *      @sense_buf: result sense data buffer (SCSI_SENSE_BUFFERSIZE bytes long)
1617  *      @dfl_sense_key: default sense key to use
1618  *
1619  *      Perform ATAPI REQUEST_SENSE after the device reported CHECK
1620  *      SENSE.  This function is EH helper.
1621  *
1622  *      LOCKING:
1623  *      Kernel thread context (may sleep).
1624  *
1625  *      RETURNS:
1626  *      0 on success, AC_ERR_* mask on failure
1627  */
1628 unsigned int atapi_eh_request_sense(struct ata_device *dev,
1629                                            u8 *sense_buf, u8 dfl_sense_key)
1630 {
1631         u8 cdb[ATAPI_CDB_LEN] =
1632                 { REQUEST_SENSE, 0, 0, 0, SCSI_SENSE_BUFFERSIZE, 0 };
1633         struct ata_port *ap = dev->link->ap;
1634         struct ata_taskfile tf;
1635
1636         DPRINTK("ATAPI request sense\n");
1637
1638         memset(sense_buf, 0, SCSI_SENSE_BUFFERSIZE);
1639
1640         /* initialize sense_buf with the error register,
1641          * for the case where they are -not- overwritten
1642          */
1643         sense_buf[0] = 0x70;
1644         sense_buf[2] = dfl_sense_key;
1645
1646         /* some devices time out if garbage left in tf */
1647         ata_tf_init(dev, &tf);
1648
1649         tf.flags |= ATA_TFLAG_ISADDR | ATA_TFLAG_DEVICE;
1650         tf.command = ATA_CMD_PACKET;
1651
1652         /* is it pointless to prefer PIO for "safety reasons"? */
1653         if (ap->flags & ATA_FLAG_PIO_DMA) {
1654                 tf.protocol = ATAPI_PROT_DMA;
1655                 tf.feature |= ATAPI_PKT_DMA;
1656         } else {
1657                 tf.protocol = ATAPI_PROT_PIO;
1658                 tf.lbam = SCSI_SENSE_BUFFERSIZE;
1659                 tf.lbah = 0;
1660         }
1661
1662         return ata_exec_internal(dev, &tf, cdb, DMA_FROM_DEVICE,
1663                                  sense_buf, SCSI_SENSE_BUFFERSIZE, 0);
1664 }
1665
1666 /**
1667  *      ata_eh_analyze_serror - analyze SError for a failed port
1668  *      @link: ATA link to analyze SError for
1669  *
1670  *      Analyze SError if available and further determine cause of
1671  *      failure.
1672  *
1673  *      LOCKING:
1674  *      None.
1675  */
1676 static void ata_eh_analyze_serror(struct ata_link *link)
1677 {
1678         struct ata_eh_context *ehc = &link->eh_context;
1679         u32 serror = ehc->i.serror;
1680         unsigned int err_mask = 0, action = 0;
1681         u32 hotplug_mask;
1682
1683         if (serror & (SERR_PERSISTENT | SERR_DATA)) {
1684                 err_mask |= AC_ERR_ATA_BUS;
1685                 action |= ATA_EH_RESET;
1686         }
1687         if (serror & SERR_PROTOCOL) {
1688                 err_mask |= AC_ERR_HSM;
1689                 action |= ATA_EH_RESET;
1690         }
1691         if (serror & SERR_INTERNAL) {
1692                 err_mask |= AC_ERR_SYSTEM;
1693                 action |= ATA_EH_RESET;
1694         }
1695
1696         /* Determine whether a hotplug event has occurred.  Both
1697          * SError.N/X are considered hotplug events for enabled or
1698          * host links.  For disabled PMP links, only N bit is
1699          * considered as X bit is left at 1 for link plugging.
1700          */
1701         if (link->lpm_policy > ATA_LPM_MAX_POWER)
1702                 hotplug_mask = 0;       /* hotplug doesn't work w/ LPM */
1703         else if (!(link->flags & ATA_LFLAG_DISABLED) || ata_is_host_link(link))
1704                 hotplug_mask = SERR_PHYRDY_CHG | SERR_DEV_XCHG;
1705         else
1706                 hotplug_mask = SERR_PHYRDY_CHG;
1707
1708         if (serror & hotplug_mask)
1709                 ata_ehi_hotplugged(&ehc->i);
1710
1711         ehc->i.err_mask |= err_mask;
1712         ehc->i.action |= action;
1713 }
1714
1715 /**
1716  *      ata_eh_analyze_ncq_error - analyze NCQ error
1717  *      @link: ATA link to analyze NCQ error for
1718  *
1719  *      Read log page 10h, determine the offending qc and acquire
1720  *      error status TF.  For NCQ device errors, all LLDDs have to do
1721  *      is setting AC_ERR_DEV in ehi->err_mask.  This function takes
1722  *      care of the rest.
1723  *
1724  *      LOCKING:
1725  *      Kernel thread context (may sleep).
1726  */
1727 void ata_eh_analyze_ncq_error(struct ata_link *link)
1728 {
1729         struct ata_port *ap = link->ap;
1730         struct ata_eh_context *ehc = &link->eh_context;
1731         struct ata_device *dev = link->device;
1732         struct ata_queued_cmd *qc;
1733         struct ata_taskfile tf;
1734         int tag, rc;
1735
1736         /* if frozen, we can't do much */
1737         if (ap->pflags & ATA_PFLAG_FROZEN)
1738                 return;
1739
1740         /* is it NCQ device error? */
1741         if (!link->sactive || !(ehc->i.err_mask & AC_ERR_DEV))
1742                 return;
1743
1744         /* has LLDD analyzed already? */
1745         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
1746                 qc = __ata_qc_from_tag(ap, tag);
1747
1748                 if (!(qc->flags & ATA_QCFLAG_FAILED))
1749                         continue;
1750
1751                 if (qc->err_mask)
1752                         return;
1753         }
1754
1755         /* okay, this error is ours */
1756         memset(&tf, 0, sizeof(tf));
1757         rc = ata_eh_read_log_10h(dev, &tag, &tf);
1758         if (rc) {
1759                 ata_link_err(link, "failed to read log page 10h (errno=%d)\n",
1760                              rc);
1761                 return;
1762         }
1763
1764         if (!(link->sactive & (1 << tag))) {
1765                 ata_link_err(link, "log page 10h reported inactive tag %d\n",
1766                              tag);
1767                 return;
1768         }
1769
1770         /* we've got the perpetrator, condemn it */
1771         qc = __ata_qc_from_tag(ap, tag);
1772         memcpy(&qc->result_tf, &tf, sizeof(tf));
1773         qc->result_tf.flags = ATA_TFLAG_ISADDR | ATA_TFLAG_LBA | ATA_TFLAG_LBA48;
1774         qc->err_mask |= AC_ERR_DEV | AC_ERR_NCQ;
1775         ehc->i.err_mask &= ~AC_ERR_DEV;
1776 }
1777
1778 /**
1779  *      ata_eh_analyze_tf - analyze taskfile of a failed qc
1780  *      @qc: qc to analyze
1781  *      @tf: Taskfile registers to analyze
1782  *
1783  *      Analyze taskfile of @qc and further determine cause of
1784  *      failure.  This function also requests ATAPI sense data if
1785  *      available.
1786  *
1787  *      LOCKING:
1788  *      Kernel thread context (may sleep).
1789  *
1790  *      RETURNS:
1791  *      Determined recovery action
1792  */
1793 static unsigned int ata_eh_analyze_tf(struct ata_queued_cmd *qc,
1794                                       const struct ata_taskfile *tf)
1795 {
1796         unsigned int tmp, action = 0;
1797         u8 stat = tf->command, err = tf->feature;
1798
1799         if ((stat & (ATA_BUSY | ATA_DRQ | ATA_DRDY)) != ATA_DRDY) {
1800                 qc->err_mask |= AC_ERR_HSM;
1801                 return ATA_EH_RESET;
1802         }
1803
1804         if (stat & (ATA_ERR | ATA_DF))
1805                 qc->err_mask |= AC_ERR_DEV;
1806         else
1807                 return 0;
1808
1809         switch (qc->dev->class) {
1810         case ATA_DEV_ATA:
1811         case ATA_DEV_ZAC:
1812                 if (err & ATA_ICRC)
1813                         qc->err_mask |= AC_ERR_ATA_BUS;
1814                 if (err & (ATA_UNC | ATA_AMNF))
1815                         qc->err_mask |= AC_ERR_MEDIA;
1816                 if (err & ATA_IDNF)
1817                         qc->err_mask |= AC_ERR_INVALID;
1818                 break;
1819
1820         case ATA_DEV_ATAPI:
1821                 if (!(qc->ap->pflags & ATA_PFLAG_FROZEN)) {
1822                         tmp = atapi_eh_request_sense(qc->dev,
1823                                                 qc->scsicmd->sense_buffer,
1824                                                 qc->result_tf.feature >> 4);
1825                         if (!tmp) {
1826                                 /* ATA_QCFLAG_SENSE_VALID is used to
1827                                  * tell atapi_qc_complete() that sense
1828                                  * data is already valid.
1829                                  *
1830                                  * TODO: interpret sense data and set
1831                                  * appropriate err_mask.
1832                                  */
1833                                 qc->flags |= ATA_QCFLAG_SENSE_VALID;
1834                         } else
1835                                 qc->err_mask |= tmp;
1836                 }
1837         }
1838
1839         if (qc->err_mask & (AC_ERR_HSM | AC_ERR_TIMEOUT | AC_ERR_ATA_BUS))
1840                 action |= ATA_EH_RESET;
1841
1842         return action;
1843 }
1844
1845 static int ata_eh_categorize_error(unsigned int eflags, unsigned int err_mask,
1846                                    int *xfer_ok)
1847 {
1848         int base = 0;
1849
1850         if (!(eflags & ATA_EFLAG_DUBIOUS_XFER))
1851                 *xfer_ok = 1;
1852
1853         if (!*xfer_ok)
1854                 base = ATA_ECAT_DUBIOUS_NONE;
1855
1856         if (err_mask & AC_ERR_ATA_BUS)
1857                 return base + ATA_ECAT_ATA_BUS;
1858
1859         if (err_mask & AC_ERR_TIMEOUT)
1860                 return base + ATA_ECAT_TOUT_HSM;
1861
1862         if (eflags & ATA_EFLAG_IS_IO) {
1863                 if (err_mask & AC_ERR_HSM)
1864                         return base + ATA_ECAT_TOUT_HSM;
1865                 if ((err_mask &
1866                      (AC_ERR_DEV|AC_ERR_MEDIA|AC_ERR_INVALID)) == AC_ERR_DEV)
1867                         return base + ATA_ECAT_UNK_DEV;
1868         }
1869
1870         return 0;
1871 }
1872
1873 struct speed_down_verdict_arg {
1874         u64 since;
1875         int xfer_ok;
1876         int nr_errors[ATA_ECAT_NR];
1877 };
1878
1879 static int speed_down_verdict_cb(struct ata_ering_entry *ent, void *void_arg)
1880 {
1881         struct speed_down_verdict_arg *arg = void_arg;
1882         int cat;
1883
1884         if ((ent->eflags & ATA_EFLAG_OLD_ER) || (ent->timestamp < arg->since))
1885                 return -1;
1886
1887         cat = ata_eh_categorize_error(ent->eflags, ent->err_mask,
1888                                       &arg->xfer_ok);
1889         arg->nr_errors[cat]++;
1890
1891         return 0;
1892 }
1893
1894 /**
1895  *      ata_eh_speed_down_verdict - Determine speed down verdict
1896  *      @dev: Device of interest
1897  *
1898  *      This function examines error ring of @dev and determines
1899  *      whether NCQ needs to be turned off, transfer speed should be
1900  *      stepped down, or falling back to PIO is necessary.
1901  *
1902  *      ECAT_ATA_BUS    : ATA_BUS error for any command
1903  *
1904  *      ECAT_TOUT_HSM   : TIMEOUT for any command or HSM violation for
1905  *                        IO commands
1906  *
1907  *      ECAT_UNK_DEV    : Unknown DEV error for IO commands
1908  *
1909  *      ECAT_DUBIOUS_*  : Identical to above three but occurred while
1910  *                        data transfer hasn't been verified.
1911  *
1912  *      Verdicts are
1913  *
1914  *      NCQ_OFF         : Turn off NCQ.
1915  *
1916  *      SPEED_DOWN      : Speed down transfer speed but don't fall back
1917  *                        to PIO.
1918  *
1919  *      FALLBACK_TO_PIO : Fall back to PIO.
1920  *
1921  *      Even if multiple verdicts are returned, only one action is
1922  *      taken per error.  An action triggered by non-DUBIOUS errors
1923  *      clears ering, while one triggered by DUBIOUS_* errors doesn't.
1924  *      This is to expedite speed down decisions right after device is
1925  *      initially configured.
1926  *
1927  *      The followings are speed down rules.  #1 and #2 deal with
1928  *      DUBIOUS errors.
1929  *
1930  *      1. If more than one DUBIOUS_ATA_BUS or DUBIOUS_TOUT_HSM errors
1931  *         occurred during last 5 mins, SPEED_DOWN and FALLBACK_TO_PIO.
1932  *
1933  *      2. If more than one DUBIOUS_TOUT_HSM or DUBIOUS_UNK_DEV errors
1934  *         occurred during last 5 mins, NCQ_OFF.
1935  *
1936  *      3. If more than 8 ATA_BUS, TOUT_HSM or UNK_DEV errors
1937  *         occurred during last 5 mins, FALLBACK_TO_PIO
1938  *
1939  *      4. If more than 3 TOUT_HSM or UNK_DEV errors occurred
1940  *         during last 10 mins, NCQ_OFF.
1941  *
1942  *      5. If more than 3 ATA_BUS or TOUT_HSM errors, or more than 6
1943  *         UNK_DEV errors occurred during last 10 mins, SPEED_DOWN.
1944  *
1945  *      LOCKING:
1946  *      Inherited from caller.
1947  *
1948  *      RETURNS:
1949  *      OR of ATA_EH_SPDN_* flags.
1950  */
1951 static unsigned int ata_eh_speed_down_verdict(struct ata_device *dev)
1952 {
1953         const u64 j5mins = 5LLU * 60 * HZ, j10mins = 10LLU * 60 * HZ;
1954         u64 j64 = get_jiffies_64();
1955         struct speed_down_verdict_arg arg;
1956         unsigned int verdict = 0;
1957
1958         /* scan past 5 mins of error history */
1959         memset(&arg, 0, sizeof(arg));
1960         arg.since = j64 - min(j64, j5mins);
1961         ata_ering_map(&dev->ering, speed_down_verdict_cb, &arg);
1962
1963         if (arg.nr_errors[ATA_ECAT_DUBIOUS_ATA_BUS] +
1964             arg.nr_errors[ATA_ECAT_DUBIOUS_TOUT_HSM] > 1)
1965                 verdict |= ATA_EH_SPDN_SPEED_DOWN |
1966                         ATA_EH_SPDN_FALLBACK_TO_PIO | ATA_EH_SPDN_KEEP_ERRORS;
1967
1968         if (arg.nr_errors[ATA_ECAT_DUBIOUS_TOUT_HSM] +
1969             arg.nr_errors[ATA_ECAT_DUBIOUS_UNK_DEV] > 1)
1970                 verdict |= ATA_EH_SPDN_NCQ_OFF | ATA_EH_SPDN_KEEP_ERRORS;
1971
1972         if (arg.nr_errors[ATA_ECAT_ATA_BUS] +
1973             arg.nr_errors[ATA_ECAT_TOUT_HSM] +
1974             arg.nr_errors[ATA_ECAT_UNK_DEV] > 6)
1975                 verdict |= ATA_EH_SPDN_FALLBACK_TO_PIO;
1976
1977         /* scan past 10 mins of error history */
1978         memset(&arg, 0, sizeof(arg));
1979         arg.since = j64 - min(j64, j10mins);
1980         ata_ering_map(&dev->ering, speed_down_verdict_cb, &arg);
1981
1982         if (arg.nr_errors[ATA_ECAT_TOUT_HSM] +
1983             arg.nr_errors[ATA_ECAT_UNK_DEV] > 3)
1984                 verdict |= ATA_EH_SPDN_NCQ_OFF;
1985
1986         if (arg.nr_errors[ATA_ECAT_ATA_BUS] +
1987             arg.nr_errors[ATA_ECAT_TOUT_HSM] > 3 ||
1988             arg.nr_errors[ATA_ECAT_UNK_DEV] > 6)
1989                 verdict |= ATA_EH_SPDN_SPEED_DOWN;
1990
1991         return verdict;
1992 }
1993
1994 /**
1995  *      ata_eh_speed_down - record error and speed down if necessary
1996  *      @dev: Failed device
1997  *      @eflags: mask of ATA_EFLAG_* flags
1998  *      @err_mask: err_mask of the error
1999  *
2000  *      Record error and examine error history to determine whether
2001  *      adjusting transmission speed is necessary.  It also sets
2002  *      transmission limits appropriately if such adjustment is
2003  *      necessary.
2004  *
2005  *      LOCKING:
2006  *      Kernel thread context (may sleep).
2007  *
2008  *      RETURNS:
2009  *      Determined recovery action.
2010  */
2011 static unsigned int ata_eh_speed_down(struct ata_device *dev,
2012                                 unsigned int eflags, unsigned int err_mask)
2013 {
2014         struct ata_link *link = ata_dev_phys_link(dev);
2015         int xfer_ok = 0;
2016         unsigned int verdict;
2017         unsigned int action = 0;
2018
2019         /* don't bother if Cat-0 error */
2020         if (ata_eh_categorize_error(eflags, err_mask, &xfer_ok) == 0)
2021                 return 0;
2022
2023         /* record error and determine whether speed down is necessary */
2024         ata_ering_record(&dev->ering, eflags, err_mask);
2025         verdict = ata_eh_speed_down_verdict(dev);
2026
2027         /* turn off NCQ? */
2028         if ((verdict & ATA_EH_SPDN_NCQ_OFF) &&
2029             (dev->flags & (ATA_DFLAG_PIO | ATA_DFLAG_NCQ |
2030                            ATA_DFLAG_NCQ_OFF)) == ATA_DFLAG_NCQ) {
2031                 dev->flags |= ATA_DFLAG_NCQ_OFF;
2032                 ata_dev_warn(dev, "NCQ disabled due to excessive errors\n");
2033                 goto done;
2034         }
2035
2036         /* speed down? */
2037         if (verdict & ATA_EH_SPDN_SPEED_DOWN) {
2038                 /* speed down SATA link speed if possible */
2039                 if (sata_down_spd_limit(link, 0) == 0) {
2040                         action |= ATA_EH_RESET;
2041                         goto done;
2042                 }
2043
2044                 /* lower transfer mode */
2045                 if (dev->spdn_cnt < 2) {
2046                         static const int dma_dnxfer_sel[] =
2047                                 { ATA_DNXFER_DMA, ATA_DNXFER_40C };
2048                         static const int pio_dnxfer_sel[] =
2049                                 { ATA_DNXFER_PIO, ATA_DNXFER_FORCE_PIO0 };
2050                         int sel;
2051
2052                         if (dev->xfer_shift != ATA_SHIFT_PIO)
2053                                 sel = dma_dnxfer_sel[dev->spdn_cnt];
2054                         else
2055                                 sel = pio_dnxfer_sel[dev->spdn_cnt];
2056
2057                         dev->spdn_cnt++;
2058
2059                         if (ata_down_xfermask_limit(dev, sel) == 0) {
2060                                 action |= ATA_EH_RESET;
2061                                 goto done;
2062                         }
2063                 }
2064         }
2065
2066         /* Fall back to PIO?  Slowing down to PIO is meaningless for
2067          * SATA ATA devices.  Consider it only for PATA and SATAPI.
2068          */
2069         if ((verdict & ATA_EH_SPDN_FALLBACK_TO_PIO) && (dev->spdn_cnt >= 2) &&
2070             (link->ap->cbl != ATA_CBL_SATA || dev->class == ATA_DEV_ATAPI) &&
2071             (dev->xfer_shift != ATA_SHIFT_PIO)) {
2072                 if (ata_down_xfermask_limit(dev, ATA_DNXFER_FORCE_PIO) == 0) {
2073                         dev->spdn_cnt = 0;
2074                         action |= ATA_EH_RESET;
2075                         goto done;
2076                 }
2077         }
2078
2079         return 0;
2080  done:
2081         /* device has been slowed down, blow error history */
2082         if (!(verdict & ATA_EH_SPDN_KEEP_ERRORS))
2083                 ata_ering_clear(&dev->ering);
2084         return action;
2085 }
2086
2087 /**
2088  *      ata_eh_worth_retry - analyze error and decide whether to retry
2089  *      @qc: qc to possibly retry
2090  *
2091  *      Look at the cause of the error and decide if a retry
2092  *      might be useful or not.  We don't want to retry media errors
2093  *      because the drive itself has probably already taken 10-30 seconds
2094  *      doing its own internal retries before reporting the failure.
2095  */
2096 static inline int ata_eh_worth_retry(struct ata_queued_cmd *qc)
2097 {
2098         if (qc->err_mask & AC_ERR_MEDIA)
2099                 return 0;       /* don't retry media errors */
2100         if (qc->flags & ATA_QCFLAG_IO)
2101                 return 1;       /* otherwise retry anything from fs stack */
2102         if (qc->err_mask & AC_ERR_INVALID)
2103                 return 0;       /* don't retry these */
2104         return qc->err_mask != AC_ERR_DEV;  /* retry if not dev error */
2105 }
2106
2107 /**
2108  *      ata_eh_link_autopsy - analyze error and determine recovery action
2109  *      @link: host link to perform autopsy on
2110  *
2111  *      Analyze why @link failed and determine which recovery actions
2112  *      are needed.  This function also sets more detailed AC_ERR_*
2113  *      values and fills sense data for ATAPI CHECK SENSE.
2114  *
2115  *      LOCKING:
2116  *      Kernel thread context (may sleep).
2117  */
2118 static void ata_eh_link_autopsy(struct ata_link *link)
2119 {
2120         struct ata_port *ap = link->ap;
2121         struct ata_eh_context *ehc = &link->eh_context;
2122         struct ata_device *dev;
2123         unsigned int all_err_mask = 0, eflags = 0;
2124         int tag;
2125         u32 serror;
2126         int rc;
2127
2128         DPRINTK("ENTER\n");
2129
2130         if (ehc->i.flags & ATA_EHI_NO_AUTOPSY)
2131                 return;
2132
2133         /* obtain and analyze SError */
2134         rc = sata_scr_read(link, SCR_ERROR, &serror);
2135         if (rc == 0) {
2136                 ehc->i.serror |= serror;
2137                 ata_eh_analyze_serror(link);
2138         } else if (rc != -EOPNOTSUPP) {
2139                 /* SError read failed, force reset and probing */
2140                 ehc->i.probe_mask |= ATA_ALL_DEVICES;
2141                 ehc->i.action |= ATA_EH_RESET;
2142                 ehc->i.err_mask |= AC_ERR_OTHER;
2143         }
2144
2145         /* analyze NCQ failure */
2146         ata_eh_analyze_ncq_error(link);
2147
2148         /* any real error trumps AC_ERR_OTHER */
2149         if (ehc->i.err_mask & ~AC_ERR_OTHER)
2150                 ehc->i.err_mask &= ~AC_ERR_OTHER;
2151
2152         all_err_mask |= ehc->i.err_mask;
2153
2154         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
2155                 struct ata_queued_cmd *qc = __ata_qc_from_tag(ap, tag);
2156
2157                 if (!(qc->flags & ATA_QCFLAG_FAILED) ||
2158                     ata_dev_phys_link(qc->dev) != link)
2159                         continue;
2160
2161                 /* inherit upper level err_mask */
2162                 qc->err_mask |= ehc->i.err_mask;
2163
2164                 /* analyze TF */
2165                 ehc->i.action |= ata_eh_analyze_tf(qc, &qc->result_tf);
2166
2167                 /* DEV errors are probably spurious in case of ATA_BUS error */
2168                 if (qc->err_mask & AC_ERR_ATA_BUS)
2169                         qc->err_mask &= ~(AC_ERR_DEV | AC_ERR_MEDIA |
2170                                           AC_ERR_INVALID);
2171
2172                 /* any real error trumps unknown error */
2173                 if (qc->err_mask & ~AC_ERR_OTHER)
2174                         qc->err_mask &= ~AC_ERR_OTHER;
2175
2176                 /* SENSE_VALID trumps dev/unknown error and revalidation */
2177                 if (qc->flags & ATA_QCFLAG_SENSE_VALID)
2178                         qc->err_mask &= ~(AC_ERR_DEV | AC_ERR_OTHER);
2179
2180                 /* determine whether the command is worth retrying */
2181                 if (ata_eh_worth_retry(qc))
2182                         qc->flags |= ATA_QCFLAG_RETRY;
2183
2184                 /* accumulate error info */
2185                 ehc->i.dev = qc->dev;
2186                 all_err_mask |= qc->err_mask;
2187                 if (qc->flags & ATA_QCFLAG_IO)
2188                         eflags |= ATA_EFLAG_IS_IO;
2189         }
2190
2191         /* enforce default EH actions */
2192         if (ap->pflags & ATA_PFLAG_FROZEN ||
2193             all_err_mask & (AC_ERR_HSM | AC_ERR_TIMEOUT))
2194                 ehc->i.action |= ATA_EH_RESET;
2195         else if (((eflags & ATA_EFLAG_IS_IO) && all_err_mask) ||
2196                  (!(eflags & ATA_EFLAG_IS_IO) && (all_err_mask & ~AC_ERR_DEV)))
2197                 ehc->i.action |= ATA_EH_REVALIDATE;
2198
2199         /* If we have offending qcs and the associated failed device,
2200          * perform per-dev EH action only on the offending device.
2201          */
2202         if (ehc->i.dev) {
2203                 ehc->i.dev_action[ehc->i.dev->devno] |=
2204                         ehc->i.action & ATA_EH_PERDEV_MASK;
2205                 ehc->i.action &= ~ATA_EH_PERDEV_MASK;
2206         }
2207
2208         /* propagate timeout to host link */
2209         if ((all_err_mask & AC_ERR_TIMEOUT) && !ata_is_host_link(link))
2210                 ap->link.eh_context.i.err_mask |= AC_ERR_TIMEOUT;
2211
2212         /* record error and consider speeding down */
2213         dev = ehc->i.dev;
2214         if (!dev && ((ata_link_max_devices(link) == 1 &&
2215                       ata_dev_enabled(link->device))))
2216             dev = link->device;
2217
2218         if (dev) {
2219                 if (dev->flags & ATA_DFLAG_DUBIOUS_XFER)
2220                         eflags |= ATA_EFLAG_DUBIOUS_XFER;
2221                 ehc->i.action |= ata_eh_speed_down(dev, eflags, all_err_mask);
2222         }
2223
2224         DPRINTK("EXIT\n");
2225 }
2226
2227 /**
2228  *      ata_eh_autopsy - analyze error and determine recovery action
2229  *      @ap: host port to perform autopsy on
2230  *
2231  *      Analyze all links of @ap and determine why they failed and
2232  *      which recovery actions are needed.
2233  *
2234  *      LOCKING:
2235  *      Kernel thread context (may sleep).
2236  */
2237 void ata_eh_autopsy(struct ata_port *ap)
2238 {
2239         struct ata_link *link;
2240
2241         ata_for_each_link(link, ap, EDGE)
2242                 ata_eh_link_autopsy(link);
2243
2244         /* Handle the frigging slave link.  Autopsy is done similarly
2245          * but actions and flags are transferred over to the master
2246          * link and handled from there.
2247          */
2248         if (ap->slave_link) {
2249                 struct ata_eh_context *mehc = &ap->link.eh_context;
2250                 struct ata_eh_context *sehc = &ap->slave_link->eh_context;
2251
2252                 /* transfer control flags from master to slave */
2253                 sehc->i.flags |= mehc->i.flags & ATA_EHI_TO_SLAVE_MASK;
2254
2255                 /* perform autopsy on the slave link */
2256                 ata_eh_link_autopsy(ap->slave_link);
2257
2258                 /* transfer actions from slave to master and clear slave */
2259                 ata_eh_about_to_do(ap->slave_link, NULL, ATA_EH_ALL_ACTIONS);
2260                 mehc->i.action          |= sehc->i.action;
2261                 mehc->i.dev_action[1]   |= sehc->i.dev_action[1];
2262                 mehc->i.flags           |= sehc->i.flags;
2263                 ata_eh_done(ap->slave_link, NULL, ATA_EH_ALL_ACTIONS);
2264         }
2265
2266         /* Autopsy of fanout ports can affect host link autopsy.
2267          * Perform host link autopsy last.
2268          */
2269         if (sata_pmp_attached(ap))
2270                 ata_eh_link_autopsy(&ap->link);
2271 }
2272
2273 /**
2274  *      ata_get_cmd_descript - get description for ATA command
2275  *      @command: ATA command code to get description for
2276  *
2277  *      Return a textual description of the given command, or NULL if the
2278  *      command is not known.
2279  *
2280  *      LOCKING:
2281  *      None
2282  */
2283 const char *ata_get_cmd_descript(u8 command)
2284 {
2285 #ifdef CONFIG_ATA_VERBOSE_ERROR
2286         static const struct
2287         {
2288                 u8 command;
2289                 const char *text;
2290         } cmd_descr[] = {
2291                 { ATA_CMD_DEV_RESET,            "DEVICE RESET" },
2292                 { ATA_CMD_CHK_POWER,            "CHECK POWER MODE" },
2293                 { ATA_CMD_STANDBY,              "STANDBY" },
2294                 { ATA_CMD_IDLE,                 "IDLE" },
2295                 { ATA_CMD_EDD,                  "EXECUTE DEVICE DIAGNOSTIC" },
2296                 { ATA_CMD_DOWNLOAD_MICRO,       "DOWNLOAD MICROCODE" },
2297                 { ATA_CMD_DOWNLOAD_MICRO_DMA,   "DOWNLOAD MICROCODE DMA" },
2298                 { ATA_CMD_NOP,                  "NOP" },
2299                 { ATA_CMD_FLUSH,                "FLUSH CACHE" },
2300                 { ATA_CMD_FLUSH_EXT,            "FLUSH CACHE EXT" },
2301                 { ATA_CMD_ID_ATA,               "IDENTIFY DEVICE" },
2302                 { ATA_CMD_ID_ATAPI,             "IDENTIFY PACKET DEVICE" },
2303                 { ATA_CMD_SERVICE,              "SERVICE" },
2304                 { ATA_CMD_READ,                 "READ DMA" },
2305                 { ATA_CMD_READ_EXT,             "READ DMA EXT" },
2306                 { ATA_CMD_READ_QUEUED,          "READ DMA QUEUED" },
2307                 { ATA_CMD_READ_STREAM_EXT,      "READ STREAM EXT" },
2308                 { ATA_CMD_READ_STREAM_DMA_EXT,  "READ STREAM DMA EXT" },
2309                 { ATA_CMD_WRITE,                "WRITE DMA" },
2310                 { ATA_CMD_WRITE_EXT,            "WRITE DMA EXT" },
2311                 { ATA_CMD_WRITE_QUEUED,         "WRITE DMA QUEUED EXT" },
2312                 { ATA_CMD_WRITE_STREAM_EXT,     "WRITE STREAM EXT" },
2313                 { ATA_CMD_WRITE_STREAM_DMA_EXT, "WRITE STREAM DMA EXT" },
2314                 { ATA_CMD_WRITE_FUA_EXT,        "WRITE DMA FUA EXT" },
2315                 { ATA_CMD_WRITE_QUEUED_FUA_EXT, "WRITE DMA QUEUED FUA EXT" },
2316                 { ATA_CMD_FPDMA_READ,           "READ FPDMA QUEUED" },
2317                 { ATA_CMD_FPDMA_WRITE,          "WRITE FPDMA QUEUED" },
2318                 { ATA_CMD_FPDMA_SEND,           "SEND FPDMA QUEUED" },
2319                 { ATA_CMD_FPDMA_RECV,           "RECEIVE FPDMA QUEUED" },
2320                 { ATA_CMD_PIO_READ,             "READ SECTOR(S)" },
2321                 { ATA_CMD_PIO_READ_EXT,         "READ SECTOR(S) EXT" },
2322                 { ATA_CMD_PIO_WRITE,            "WRITE SECTOR(S)" },
2323                 { ATA_CMD_PIO_WRITE_EXT,        "WRITE SECTOR(S) EXT" },
2324                 { ATA_CMD_READ_MULTI,           "READ MULTIPLE" },
2325                 { ATA_CMD_READ_MULTI_EXT,       "READ MULTIPLE EXT" },
2326                 { ATA_CMD_WRITE_MULTI,          "WRITE MULTIPLE" },
2327                 { ATA_CMD_WRITE_MULTI_EXT,      "WRITE MULTIPLE EXT" },
2328                 { ATA_CMD_WRITE_MULTI_FUA_EXT,  "WRITE MULTIPLE FUA EXT" },
2329                 { ATA_CMD_SET_FEATURES,         "SET FEATURES" },
2330                 { ATA_CMD_SET_MULTI,            "SET MULTIPLE MODE" },
2331                 { ATA_CMD_VERIFY,               "READ VERIFY SECTOR(S)" },
2332                 { ATA_CMD_VERIFY_EXT,           "READ VERIFY SECTOR(S) EXT" },
2333                 { ATA_CMD_WRITE_UNCORR_EXT,     "WRITE UNCORRECTABLE EXT" },
2334                 { ATA_CMD_STANDBYNOW1,          "STANDBY IMMEDIATE" },
2335                 { ATA_CMD_IDLEIMMEDIATE,        "IDLE IMMEDIATE" },
2336                 { ATA_CMD_SLEEP,                "SLEEP" },
2337                 { ATA_CMD_INIT_DEV_PARAMS,      "INITIALIZE DEVICE PARAMETERS" },
2338                 { ATA_CMD_READ_NATIVE_MAX,      "READ NATIVE MAX ADDRESS" },
2339                 { ATA_CMD_READ_NATIVE_MAX_EXT,  "READ NATIVE MAX ADDRESS EXT" },
2340                 { ATA_CMD_SET_MAX,              "SET MAX ADDRESS" },
2341                 { ATA_CMD_SET_MAX_EXT,          "SET MAX ADDRESS EXT" },
2342                 { ATA_CMD_READ_LOG_EXT,         "READ LOG EXT" },
2343                 { ATA_CMD_WRITE_LOG_EXT,        "WRITE LOG EXT" },
2344                 { ATA_CMD_READ_LOG_DMA_EXT,     "READ LOG DMA EXT" },
2345                 { ATA_CMD_WRITE_LOG_DMA_EXT,    "WRITE LOG DMA EXT" },
2346                 { ATA_CMD_TRUSTED_NONDATA,      "TRUSTED NON-DATA" },
2347                 { ATA_CMD_TRUSTED_RCV,          "TRUSTED RECEIVE" },
2348                 { ATA_CMD_TRUSTED_RCV_DMA,      "TRUSTED RECEIVE DMA" },
2349                 { ATA_CMD_TRUSTED_SND,          "TRUSTED SEND" },
2350                 { ATA_CMD_TRUSTED_SND_DMA,      "TRUSTED SEND DMA" },
2351                 { ATA_CMD_PMP_READ,             "READ BUFFER" },
2352                 { ATA_CMD_PMP_READ_DMA,         "READ BUFFER DMA" },
2353                 { ATA_CMD_PMP_WRITE,            "WRITE BUFFER" },
2354                 { ATA_CMD_PMP_WRITE_DMA,        "WRITE BUFFER DMA" },
2355                 { ATA_CMD_CONF_OVERLAY,         "DEVICE CONFIGURATION OVERLAY" },
2356                 { ATA_CMD_SEC_SET_PASS,         "SECURITY SET PASSWORD" },
2357                 { ATA_CMD_SEC_UNLOCK,           "SECURITY UNLOCK" },
2358                 { ATA_CMD_SEC_ERASE_PREP,       "SECURITY ERASE PREPARE" },
2359                 { ATA_CMD_SEC_ERASE_UNIT,       "SECURITY ERASE UNIT" },
2360                 { ATA_CMD_SEC_FREEZE_LOCK,      "SECURITY FREEZE LOCK" },
2361                 { ATA_CMD_SEC_DISABLE_PASS,     "SECURITY DISABLE PASSWORD" },
2362                 { ATA_CMD_CONFIG_STREAM,        "CONFIGURE STREAM" },
2363                 { ATA_CMD_SMART,                "SMART" },
2364                 { ATA_CMD_MEDIA_LOCK,           "DOOR LOCK" },
2365                 { ATA_CMD_MEDIA_UNLOCK,         "DOOR UNLOCK" },
2366                 { ATA_CMD_DSM,                  "DATA SET MANAGEMENT" },
2367                 { ATA_CMD_CHK_MED_CRD_TYP,      "CHECK MEDIA CARD TYPE" },
2368                 { ATA_CMD_CFA_REQ_EXT_ERR,      "CFA REQUEST EXTENDED ERROR" },
2369                 { ATA_CMD_CFA_WRITE_NE,         "CFA WRITE SECTORS WITHOUT ERASE" },
2370                 { ATA_CMD_CFA_TRANS_SECT,       "CFA TRANSLATE SECTOR" },
2371                 { ATA_CMD_CFA_ERASE,            "CFA ERASE SECTORS" },
2372                 { ATA_CMD_CFA_WRITE_MULT_NE,    "CFA WRITE MULTIPLE WITHOUT ERASE" },
2373                 { ATA_CMD_REQ_SENSE_DATA,       "REQUEST SENSE DATA EXT" },
2374                 { ATA_CMD_SANITIZE_DEVICE,      "SANITIZE DEVICE" },
2375                 { ATA_CMD_READ_LONG,            "READ LONG (with retries)" },
2376                 { ATA_CMD_READ_LONG_ONCE,       "READ LONG (without retries)" },
2377                 { ATA_CMD_WRITE_LONG,           "WRITE LONG (with retries)" },
2378                 { ATA_CMD_WRITE_LONG_ONCE,      "WRITE LONG (without retries)" },
2379                 { ATA_CMD_RESTORE,              "RECALIBRATE" },
2380                 { 0,                            NULL } /* terminate list */
2381         };
2382
2383         unsigned int i;
2384         for (i = 0; cmd_descr[i].text; i++)
2385                 if (cmd_descr[i].command == command)
2386                         return cmd_descr[i].text;
2387 #endif
2388
2389         return NULL;
2390 }
2391 EXPORT_SYMBOL_GPL(ata_get_cmd_descript);
2392
2393 /**
2394  *      ata_eh_link_report - report error handling to user
2395  *      @link: ATA link EH is going on
2396  *
2397  *      Report EH to user.
2398  *
2399  *      LOCKING:
2400  *      None.
2401  */
2402 static void ata_eh_link_report(struct ata_link *link)
2403 {
2404         struct ata_port *ap = link->ap;
2405         struct ata_eh_context *ehc = &link->eh_context;
2406         const char *frozen, *desc;
2407         char tries_buf[6] = "";
2408         int tag, nr_failed = 0;
2409
2410         if (ehc->i.flags & ATA_EHI_QUIET)
2411                 return;
2412
2413         desc = NULL;
2414         if (ehc->i.desc[0] != '\0')
2415                 desc = ehc->i.desc;
2416
2417         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
2418                 struct ata_queued_cmd *qc = __ata_qc_from_tag(ap, tag);
2419
2420                 if (!(qc->flags & ATA_QCFLAG_FAILED) ||
2421                     ata_dev_phys_link(qc->dev) != link ||
2422                     ((qc->flags & ATA_QCFLAG_QUIET) &&
2423                      qc->err_mask == AC_ERR_DEV))
2424                         continue;
2425                 if (qc->flags & ATA_QCFLAG_SENSE_VALID && !qc->err_mask)
2426                         continue;
2427
2428                 nr_failed++;
2429         }
2430
2431         if (!nr_failed && !ehc->i.err_mask)
2432                 return;
2433
2434         frozen = "";
2435         if (ap->pflags & ATA_PFLAG_FROZEN)
2436                 frozen = " frozen";
2437
2438         if (ap->eh_tries < ATA_EH_MAX_TRIES)
2439                 snprintf(tries_buf, sizeof(tries_buf), " t%d",
2440                          ap->eh_tries);
2441
2442         if (ehc->i.dev) {
2443                 ata_dev_err(ehc->i.dev, "exception Emask 0x%x "
2444                             "SAct 0x%x SErr 0x%x action 0x%x%s%s\n",
2445                             ehc->i.err_mask, link->sactive, ehc->i.serror,
2446                             ehc->i.action, frozen, tries_buf);
2447                 if (desc)
2448                         ata_dev_err(ehc->i.dev, "%s\n", desc);
2449         } else {
2450                 ata_link_err(link, "exception Emask 0x%x "
2451                              "SAct 0x%x SErr 0x%x action 0x%x%s%s\n",
2452                              ehc->i.err_mask, link->sactive, ehc->i.serror,
2453                              ehc->i.action, frozen, tries_buf);
2454                 if (desc)
2455                         ata_link_err(link, "%s\n", desc);
2456         }
2457
2458 #ifdef CONFIG_ATA_VERBOSE_ERROR
2459         if (ehc->i.serror)
2460                 ata_link_err(link,
2461                   "SError: { %s%s%s%s%s%s%s%s%s%s%s%s%s%s%s%s%s}\n",
2462                   ehc->i.serror & SERR_DATA_RECOVERED ? "RecovData " : "",
2463                   ehc->i.serror & SERR_COMM_RECOVERED ? "RecovComm " : "",
2464                   ehc->i.serror & SERR_DATA ? "UnrecovData " : "",
2465                   ehc->i.serror & SERR_PERSISTENT ? "Persist " : "",
2466                   ehc->i.serror & SERR_PROTOCOL ? "Proto " : "",
2467                   ehc->i.serror & SERR_INTERNAL ? "HostInt " : "",
2468                   ehc->i.serror & SERR_PHYRDY_CHG ? "PHYRdyChg " : "",
2469                   ehc->i.serror & SERR_PHY_INT_ERR ? "PHYInt " : "",
2470                   ehc->i.serror & SERR_COMM_WAKE ? "CommWake " : "",
2471                   ehc->i.serror & SERR_10B_8B_ERR ? "10B8B " : "",
2472                   ehc->i.serror & SERR_DISPARITY ? "Dispar " : "",
2473                   ehc->i.serror & SERR_CRC ? "BadCRC " : "",
2474                   ehc->i.serror & SERR_HANDSHAKE ? "Handshk " : "",
2475                   ehc->i.serror & SERR_LINK_SEQ_ERR ? "LinkSeq " : "",
2476                   ehc->i.serror & SERR_TRANS_ST_ERROR ? "TrStaTrns " : "",
2477                   ehc->i.serror & SERR_UNRECOG_FIS ? "UnrecFIS " : "",
2478                   ehc->i.serror & SERR_DEV_XCHG ? "DevExch " : "");
2479 #endif
2480
2481         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
2482                 struct ata_queued_cmd *qc = __ata_qc_from_tag(ap, tag);
2483                 struct ata_taskfile *cmd = &qc->tf, *res = &qc->result_tf;
2484                 const u8 *cdb = qc->cdb;
2485                 char data_buf[20] = "";
2486                 char cdb_buf[70] = "";
2487
2488                 if (!(qc->flags & ATA_QCFLAG_FAILED) ||
2489                     ata_dev_phys_link(qc->dev) != link || !qc->err_mask)
2490                         continue;
2491
2492                 if (qc->dma_dir != DMA_NONE) {
2493                         static const char *dma_str[] = {
2494                                 [DMA_BIDIRECTIONAL]     = "bidi",
2495                                 [DMA_TO_DEVICE]         = "out",
2496                                 [DMA_FROM_DEVICE]       = "in",
2497                         };
2498                         static const char *prot_str[] = {
2499                                 [ATA_PROT_PIO]          = "pio",
2500                                 [ATA_PROT_DMA]          = "dma",
2501                                 [ATA_PROT_NCQ]          = "ncq",
2502                                 [ATAPI_PROT_PIO]        = "pio",
2503                                 [ATAPI_PROT_DMA]        = "dma",
2504                         };
2505
2506                         snprintf(data_buf, sizeof(data_buf), " %s %u %s",
2507                                  prot_str[qc->tf.protocol], qc->nbytes,
2508                                  dma_str[qc->dma_dir]);
2509                 }
2510
2511                 if (ata_is_atapi(qc->tf.protocol)) {
2512                         if (qc->scsicmd)
2513                                 scsi_print_command(qc->scsicmd);
2514                         else
2515                                 snprintf(cdb_buf, sizeof(cdb_buf),
2516                                  "cdb %02x %02x %02x %02x %02x %02x %02x %02x  "
2517                                  "%02x %02x %02x %02x %02x %02x %02x %02x\n         ",
2518                                  cdb[0], cdb[1], cdb[2], cdb[3],
2519                                  cdb[4], cdb[5], cdb[6], cdb[7],
2520                                  cdb[8], cdb[9], cdb[10], cdb[11],
2521                                  cdb[12], cdb[13], cdb[14], cdb[15]);
2522                 } else {
2523                         const char *descr = ata_get_cmd_descript(cmd->command);
2524                         if (descr)
2525                                 ata_dev_err(qc->dev, "failed command: %s\n",
2526                                             descr);
2527                 }
2528
2529                 ata_dev_err(qc->dev,
2530                         "cmd %02x/%02x:%02x:%02x:%02x:%02x/%02x:%02x:%02x:%02x:%02x/%02x "
2531                         "tag %d%s\n         %s"
2532                         "res %02x/%02x:%02x:%02x:%02x:%02x/%02x:%02x:%02x:%02x:%02x/%02x "
2533                         "Emask 0x%x (%s)%s\n",
2534                         cmd->command, cmd->feature, cmd->nsect,
2535                         cmd->lbal, cmd->lbam, cmd->lbah,
2536                         cmd->hob_feature, cmd->hob_nsect,
2537                         cmd->hob_lbal, cmd->hob_lbam, cmd->hob_lbah,
2538                         cmd->device, qc->tag, data_buf, cdb_buf,
2539                         res->command, res->feature, res->nsect,
2540                         res->lbal, res->lbam, res->lbah,
2541                         res->hob_feature, res->hob_nsect,
2542                         res->hob_lbal, res->hob_lbam, res->hob_lbah,
2543                         res->device, qc->err_mask, ata_err_string(qc->err_mask),
2544                         qc->err_mask & AC_ERR_NCQ ? " <F>" : "");
2545
2546 #ifdef CONFIG_ATA_VERBOSE_ERROR
2547                 if (res->command & (ATA_BUSY | ATA_DRDY | ATA_DF | ATA_DRQ |
2548                                     ATA_ERR)) {
2549                         if (res->command & ATA_BUSY)
2550                                 ata_dev_err(qc->dev, "status: { Busy }\n");
2551                         else
2552                                 ata_dev_err(qc->dev, "status: { %s%s%s%s}\n",
2553                                   res->command & ATA_DRDY ? "DRDY " : "",
2554                                   res->command & ATA_DF ? "DF " : "",
2555                                   res->command & ATA_DRQ ? "DRQ " : "",
2556                                   res->command & ATA_ERR ? "ERR " : "");
2557                 }
2558
2559                 if (cmd->command != ATA_CMD_PACKET &&
2560                     (res->feature & (ATA_ICRC | ATA_UNC | ATA_AMNF |
2561                                      ATA_IDNF | ATA_ABORTED)))
2562                         ata_dev_err(qc->dev, "error: { %s%s%s%s%s}\n",
2563                           res->feature & ATA_ICRC ? "ICRC " : "",
2564                           res->feature & ATA_UNC ? "UNC " : "",
2565                           res->feature & ATA_AMNF ? "AMNF " : "",
2566                           res->feature & ATA_IDNF ? "IDNF " : "",
2567                           res->feature & ATA_ABORTED ? "ABRT " : "");
2568 #endif
2569         }
2570 }
2571
2572 /**
2573  *      ata_eh_report - report error handling to user
2574  *      @ap: ATA port to report EH about
2575  *
2576  *      Report EH to user.
2577  *
2578  *      LOCKING:
2579  *      None.
2580  */
2581 void ata_eh_report(struct ata_port *ap)
2582 {
2583         struct ata_link *link;
2584
2585         ata_for_each_link(link, ap, HOST_FIRST)
2586                 ata_eh_link_report(link);
2587 }
2588
2589 static int ata_do_reset(struct ata_link *link, ata_reset_fn_t reset,
2590                         unsigned int *classes, unsigned long deadline,
2591                         bool clear_classes)
2592 {
2593         struct ata_device *dev;
2594
2595         if (clear_classes)
2596                 ata_for_each_dev(dev, link, ALL)
2597                         classes[dev->devno] = ATA_DEV_UNKNOWN;
2598
2599         return reset(link, classes, deadline);
2600 }
2601
2602 static int ata_eh_followup_srst_needed(struct ata_link *link, int rc)
2603 {
2604         if ((link->flags & ATA_LFLAG_NO_SRST) || ata_link_offline(link))
2605                 return 0;
2606         if (rc == -EAGAIN)
2607                 return 1;
2608         if (sata_pmp_supported(link->ap) && ata_is_host_link(link))
2609                 return 1;
2610         return 0;
2611 }
2612
2613 int ata_eh_reset(struct ata_link *link, int classify,
2614                  ata_prereset_fn_t prereset, ata_reset_fn_t softreset,
2615                  ata_reset_fn_t hardreset, ata_postreset_fn_t postreset)
2616 {
2617         struct ata_port *ap = link->ap;
2618         struct ata_link *slave = ap->slave_link;
2619         struct ata_eh_context *ehc = &link->eh_context;
2620         struct ata_eh_context *sehc = slave ? &slave->eh_context : NULL;
2621         unsigned int *classes = ehc->classes;
2622         unsigned int lflags = link->flags;
2623         int verbose = !(ehc->i.flags & ATA_EHI_QUIET);
2624         int max_tries = 0, try = 0;
2625         struct ata_link *failed_link;
2626         struct ata_device *dev;
2627         unsigned long deadline, now;
2628         ata_reset_fn_t reset;
2629         unsigned long flags;
2630         u32 sstatus;
2631         int nr_unknown, rc;
2632
2633         /*
2634          * Prepare to reset
2635          */
2636         while (ata_eh_reset_timeouts[max_tries] != ULONG_MAX)
2637                 max_tries++;
2638         if (link->flags & ATA_LFLAG_RST_ONCE)
2639                 max_tries = 1;
2640         if (link->flags & ATA_LFLAG_NO_HRST)
2641                 hardreset = NULL;
2642         if (link->flags & ATA_LFLAG_NO_SRST)
2643                 softreset = NULL;
2644
2645         /* make sure each reset attempt is at least COOL_DOWN apart */
2646         if (ehc->i.flags & ATA_EHI_DID_RESET) {
2647                 now = jiffies;
2648                 WARN_ON(time_after(ehc->last_reset, now));
2649                 deadline = ata_deadline(ehc->last_reset,
2650                                         ATA_EH_RESET_COOL_DOWN);
2651                 if (time_before(now, deadline))
2652                         schedule_timeout_uninterruptible(deadline - now);
2653         }
2654
2655         spin_lock_irqsave(ap->lock, flags);
2656         ap->pflags |= ATA_PFLAG_RESETTING;
2657         spin_unlock_irqrestore(ap->lock, flags);
2658
2659         ata_eh_about_to_do(link, NULL, ATA_EH_RESET);
2660
2661         ata_for_each_dev(dev, link, ALL) {
2662                 /* If we issue an SRST then an ATA drive (not ATAPI)
2663                  * may change configuration and be in PIO0 timing. If
2664                  * we do a hard reset (or are coming from power on)
2665                  * this is true for ATA or ATAPI. Until we've set a
2666                  * suitable controller mode we should not touch the
2667                  * bus as we may be talking too fast.
2668                  */
2669                 dev->pio_mode = XFER_PIO_0;
2670                 dev->dma_mode = 0xff;
2671
2672                 /* If the controller has a pio mode setup function
2673                  * then use it to set the chipset to rights. Don't
2674                  * touch the DMA setup as that will be dealt with when
2675                  * configuring devices.
2676                  */
2677                 if (ap->ops->set_piomode)
2678                         ap->ops->set_piomode(ap, dev);
2679         }
2680
2681         /* prefer hardreset */
2682         reset = NULL;
2683         ehc->i.action &= ~ATA_EH_RESET;
2684         if (hardreset) {
2685                 reset = hardreset;
2686                 ehc->i.action |= ATA_EH_HARDRESET;
2687         } else if (softreset) {
2688                 reset = softreset;
2689                 ehc->i.action |= ATA_EH_SOFTRESET;
2690         }
2691
2692         if (prereset) {
2693                 unsigned long deadline = ata_deadline(jiffies,
2694                                                       ATA_EH_PRERESET_TIMEOUT);
2695
2696                 if (slave) {
2697                         sehc->i.action &= ~ATA_EH_RESET;
2698                         sehc->i.action |= ehc->i.action;
2699                 }
2700
2701                 rc = prereset(link, deadline);
2702
2703                 /* If present, do prereset on slave link too.  Reset
2704                  * is skipped iff both master and slave links report
2705                  * -ENOENT or clear ATA_EH_RESET.
2706                  */
2707                 if (slave && (rc == 0 || rc == -ENOENT)) {
2708                         int tmp;
2709
2710                         tmp = prereset(slave, deadline);
2711                         if (tmp != -ENOENT)
2712                                 rc = tmp;
2713
2714                         ehc->i.action |= sehc->i.action;
2715                 }
2716
2717                 if (rc) {
2718                         if (rc == -ENOENT) {
2719                                 ata_link_dbg(link, "port disabled--ignoring\n");
2720                                 ehc->i.action &= ~ATA_EH_RESET;
2721
2722                                 ata_for_each_dev(dev, link, ALL)
2723                                         classes[dev->devno] = ATA_DEV_NONE;
2724
2725                                 rc = 0;
2726                         } else
2727                                 ata_link_err(link,
2728                                              "prereset failed (errno=%d)\n",
2729                                              rc);
2730                         goto out;
2731                 }
2732
2733                 /* prereset() might have cleared ATA_EH_RESET.  If so,
2734                  * bang classes, thaw and return.
2735                  */
2736                 if (reset && !(ehc->i.action & ATA_EH_RESET)) {
2737                         ata_for_each_dev(dev, link, ALL)
2738                                 classes[dev->devno] = ATA_DEV_NONE;
2739                         if ((ap->pflags & ATA_PFLAG_FROZEN) &&
2740                             ata_is_host_link(link))
2741                                 ata_eh_thaw_port(ap);
2742                         rc = 0;
2743                         goto out;
2744                 }
2745         }
2746
2747  retry:
2748         /*
2749          * Perform reset
2750          */
2751         if (ata_is_host_link(link))
2752                 ata_eh_freeze_port(ap);
2753
2754         deadline = ata_deadline(jiffies, ata_eh_reset_timeouts[try++]);
2755
2756         if (reset) {
2757                 if (verbose)
2758                         ata_link_info(link, "%s resetting link\n",
2759                                       reset == softreset ? "soft" : "hard");
2760
2761                 /* mark that this EH session started with reset */
2762                 ehc->last_reset = jiffies;
2763                 if (reset == hardreset)
2764                         ehc->i.flags |= ATA_EHI_DID_HARDRESET;
2765                 else
2766                         ehc->i.flags |= ATA_EHI_DID_SOFTRESET;
2767
2768                 rc = ata_do_reset(link, reset, classes, deadline, true);
2769                 if (rc && rc != -EAGAIN) {
2770                         failed_link = link;
2771                         goto fail;
2772                 }
2773
2774                 /* hardreset slave link if existent */
2775                 if (slave && reset == hardreset) {
2776                         int tmp;
2777
2778                         if (verbose)
2779                                 ata_link_info(slave, "hard resetting link\n");
2780
2781                         ata_eh_about_to_do(slave, NULL, ATA_EH_RESET);
2782                         tmp = ata_do_reset(slave, reset, classes, deadline,
2783                                            false);
2784                         switch (tmp) {
2785                         case -EAGAIN:
2786                                 rc = -EAGAIN;
2787                         case 0:
2788                                 break;
2789                         default:
2790                                 failed_link = slave;
2791                                 rc = tmp;
2792                                 goto fail;
2793                         }
2794                 }
2795
2796                 /* perform follow-up SRST if necessary */
2797                 if (reset == hardreset &&
2798                     ata_eh_followup_srst_needed(link, rc)) {
2799                         reset = softreset;
2800
2801                         if (!reset) {
2802                                 ata_link_err(link,
2803              "follow-up softreset required but no softreset available\n");
2804                                 failed_link = link;
2805                                 rc = -EINVAL;
2806                                 goto fail;
2807                         }
2808
2809                         ata_eh_about_to_do(link, NULL, ATA_EH_RESET);
2810                         rc = ata_do_reset(link, reset, classes, deadline, true);
2811                         if (rc) {
2812                                 failed_link = link;
2813                                 goto fail;
2814                         }
2815                 }
2816         } else {
2817                 if (verbose)
2818                         ata_link_info(link,
2819         "no reset method available, skipping reset\n");
2820                 if (!(lflags & ATA_LFLAG_ASSUME_CLASS))
2821                         lflags |= ATA_LFLAG_ASSUME_ATA;
2822         }
2823
2824         /*
2825          * Post-reset processing
2826          */
2827         ata_for_each_dev(dev, link, ALL) {
2828                 /* After the reset, the device state is PIO 0 and the
2829                  * controller state is undefined.  Reset also wakes up
2830                  * drives from sleeping mode.
2831                  */
2832                 dev->pio_mode = XFER_PIO_0;
2833                 dev->flags &= ~ATA_DFLAG_SLEEPING;
2834
2835                 if (ata_phys_link_offline(ata_dev_phys_link(dev)))
2836                         continue;
2837
2838                 /* apply class override */
2839                 if (lflags & ATA_LFLAG_ASSUME_ATA)
2840                         classes[dev->devno] = ATA_DEV_ATA;
2841                 else if (lflags & ATA_LFLAG_ASSUME_SEMB)
2842                         classes[dev->devno] = ATA_DEV_SEMB_UNSUP;
2843         }
2844
2845         /* record current link speed */
2846         if (sata_scr_read(link, SCR_STATUS, &sstatus) == 0)
2847                 link->sata_spd = (sstatus >> 4) & 0xf;
2848         if (slave && sata_scr_read(slave, SCR_STATUS, &sstatus) == 0)
2849                 slave->sata_spd = (sstatus >> 4) & 0xf;
2850
2851         /* thaw the port */
2852         if (ata_is_host_link(link))
2853                 ata_eh_thaw_port(ap);
2854
2855         /* postreset() should clear hardware SError.  Although SError
2856          * is cleared during link resume, clearing SError here is
2857          * necessary as some PHYs raise hotplug events after SRST.
2858          * This introduces race condition where hotplug occurs between
2859          * reset and here.  This race is mediated by cross checking
2860          * link onlineness and classification result later.
2861          */
2862         if (postreset) {
2863                 postreset(link, classes);
2864                 if (slave)
2865                         postreset(slave, classes);
2866         }
2867
2868         /*
2869          * Some controllers can't be frozen very well and may set spurious
2870          * error conditions during reset.  Clear accumulated error
2871          * information and re-thaw the port if frozen.  As reset is the
2872          * final recovery action and we cross check link onlineness against
2873          * device classification later, no hotplug event is lost by this.
2874          */
2875         spin_lock_irqsave(link->ap->lock, flags);
2876         memset(&link->eh_info, 0, sizeof(link->eh_info));
2877         if (slave)
2878                 memset(&slave->eh_info, 0, sizeof(link->eh_info));
2879         ap->pflags &= ~ATA_PFLAG_EH_PENDING;
2880         spin_unlock_irqrestore(link->ap->lock, flags);
2881
2882         if (ap->pflags & ATA_PFLAG_FROZEN)
2883                 ata_eh_thaw_port(ap);
2884
2885         /*
2886          * Make sure onlineness and classification result correspond.
2887          * Hotplug could have happened during reset and some
2888          * controllers fail to wait while a drive is spinning up after
2889          * being hotplugged causing misdetection.  By cross checking
2890          * link on/offlineness and classification result, those
2891          * conditions can be reliably detected and retried.
2892          */
2893         nr_unknown = 0;
2894         ata_for_each_dev(dev, link, ALL) {
2895                 if (ata_phys_link_online(ata_dev_phys_link(dev))) {
2896                         if (classes[dev->devno] == ATA_DEV_UNKNOWN) {
2897                                 ata_dev_dbg(dev, "link online but device misclassified\n");
2898                                 classes[dev->devno] = ATA_DEV_NONE;
2899                                 nr_unknown++;
2900                         }
2901                 } else if (ata_phys_link_offline(ata_dev_phys_link(dev))) {
2902                         if (ata_class_enabled(classes[dev->devno]))
2903                                 ata_dev_dbg(dev,
2904                                             "link offline, clearing class %d to NONE\n",
2905                                             classes[dev->devno]);
2906                         classes[dev->devno] = ATA_DEV_NONE;
2907                 } else if (classes[dev->devno] == ATA_DEV_UNKNOWN) {
2908                         ata_dev_dbg(dev,
2909                                     "link status unknown, clearing UNKNOWN to NONE\n");
2910                         classes[dev->devno] = ATA_DEV_NONE;
2911                 }
2912         }
2913
2914         if (classify && nr_unknown) {
2915                 if (try < max_tries) {
2916                         ata_link_warn(link,
2917                                       "link online but %d devices misclassified, retrying\n",
2918                                       nr_unknown);
2919                         failed_link = link;
2920                         rc = -EAGAIN;
2921                         goto fail;
2922                 }
2923                 ata_link_warn(link,
2924                               "link online but %d devices misclassified, "
2925                               "device detection might fail\n", nr_unknown);
2926         }
2927
2928         /* reset successful, schedule revalidation */
2929         ata_eh_done(link, NULL, ATA_EH_RESET);
2930         if (slave)
2931                 ata_eh_done(slave, NULL, ATA_EH_RESET);
2932         ehc->last_reset = jiffies;              /* update to completion time */
2933         ehc->i.action |= ATA_EH_REVALIDATE;
2934         link->lpm_policy = ATA_LPM_UNKNOWN;     /* reset LPM state */
2935
2936         rc = 0;
2937  out:
2938         /* clear hotplug flag */
2939         ehc->i.flags &= ~ATA_EHI_HOTPLUGGED;
2940         if (slave)
2941                 sehc->i.flags &= ~ATA_EHI_HOTPLUGGED;
2942
2943         spin_lock_irqsave(ap->lock, flags);
2944         ap->pflags &= ~ATA_PFLAG_RESETTING;
2945         spin_unlock_irqrestore(ap->lock, flags);
2946
2947         return rc;
2948
2949  fail:
2950         /* if SCR isn't accessible on a fan-out port, PMP needs to be reset */
2951         if (!ata_is_host_link(link) &&
2952             sata_scr_read(link, SCR_STATUS, &sstatus))
2953                 rc = -ERESTART;
2954
2955         if (try >= max_tries) {
2956                 /*
2957                  * Thaw host port even if reset failed, so that the port
2958                  * can be retried on the next phy event.  This risks
2959                  * repeated EH runs but seems to be a better tradeoff than
2960                  * shutting down a port after a botched hotplug attempt.
2961                  */
2962                 if (ata_is_host_link(link))
2963                         ata_eh_thaw_port(ap);
2964                 goto out;
2965         }
2966
2967         now = jiffies;
2968         if (time_before(now, deadline)) {
2969                 unsigned long delta = deadline - now;
2970
2971                 ata_link_warn(failed_link,
2972                         "reset failed (errno=%d), retrying in %u secs\n",
2973                         rc, DIV_ROUND_UP(jiffies_to_msecs(delta), 1000));
2974
2975                 ata_eh_release(ap);
2976                 while (delta)
2977                         delta = schedule_timeout_uninterruptible(delta);
2978                 ata_eh_acquire(ap);
2979         }
2980
2981         /*
2982          * While disks spinup behind PMP, some controllers fail sending SRST.
2983          * They need to be reset - as well as the PMP - before retrying.
2984          */
2985         if (rc == -ERESTART) {
2986                 if (ata_is_host_link(link))
2987                         ata_eh_thaw_port(ap);
2988                 goto out;
2989         }
2990
2991         if (try == max_tries - 1) {
2992                 sata_down_spd_limit(link, 0);
2993                 if (slave)
2994                         sata_down_spd_limit(slave, 0);
2995         } else if (rc == -EPIPE)
2996                 sata_down_spd_limit(failed_link, 0);
2997
2998         if (hardreset)
2999                 reset = hardreset;
3000         goto retry;
3001 }
3002
3003 static inline void ata_eh_pull_park_action(struct ata_port *ap)
3004 {
3005         struct ata_link *link;
3006         struct ata_device *dev;
3007         unsigned long flags;
3008
3009         /*
3010          * This function can be thought of as an extended version of
3011          * ata_eh_about_to_do() specially crafted to accommodate the
3012          * requirements of ATA_EH_PARK handling. Since the EH thread
3013          * does not leave the do {} while () loop in ata_eh_recover as
3014          * long as the timeout for a park request to *one* device on
3015          * the port has not expired, and since we still want to pick
3016          * up park requests to other devices on the same port or
3017          * timeout updates for the same device, we have to pull
3018          * ATA_EH_PARK actions from eh_info into eh_context.i
3019          * ourselves at the beginning of each pass over the loop.
3020          *
3021          * Additionally, all write accesses to &ap->park_req_pending
3022          * through reinit_completion() (see below) or complete_all()
3023          * (see ata_scsi_park_store()) are protected by the host lock.
3024          * As a result we have that park_req_pending.done is zero on
3025          * exit from this function, i.e. when ATA_EH_PARK actions for
3026          * *all* devices on port ap have been pulled into the
3027          * respective eh_context structs. If, and only if,
3028          * park_req_pending.done is non-zero by the time we reach
3029          * wait_for_completion_timeout(), another ATA_EH_PARK action
3030          * has been scheduled for at least one of the devices on port
3031          * ap and we have to cycle over the do {} while () loop in
3032          * ata_eh_recover() again.
3033          */
3034
3035         spin_lock_irqsave(ap->lock, flags);
3036         reinit_completion(&ap->park_req_pending);
3037         ata_for_each_link(link, ap, EDGE) {
3038                 ata_for_each_dev(dev, link, ALL) {
3039                         struct ata_eh_info *ehi = &link->eh_info;
3040
3041                         link->eh_context.i.dev_action[dev->devno] |=
3042                                 ehi->dev_action[dev->devno] & ATA_EH_PARK;
3043                         ata_eh_clear_action(link, dev, ehi, ATA_EH_PARK);
3044                 }
3045         }
3046         spin_unlock_irqrestore(ap->lock, flags);
3047 }
3048
3049 static void ata_eh_park_issue_cmd(struct ata_device *dev, int park)
3050 {
3051         struct ata_eh_context *ehc = &dev->link->eh_context;
3052         struct ata_taskfile tf;
3053         unsigned int err_mask;
3054
3055         ata_tf_init(dev, &tf);
3056         if (park) {
3057                 ehc->unloaded_mask |= 1 << dev->devno;
3058                 tf.command = ATA_CMD_IDLEIMMEDIATE;
3059                 tf.feature = 0x44;
3060                 tf.lbal = 0x4c;
3061                 tf.lbam = 0x4e;
3062                 tf.lbah = 0x55;
3063         } else {
3064                 ehc->unloaded_mask &= ~(1 << dev->devno);
3065                 tf.command = ATA_CMD_CHK_POWER;
3066         }
3067
3068         tf.flags |= ATA_TFLAG_DEVICE | ATA_TFLAG_ISADDR;
3069         tf.protocol |= ATA_PROT_NODATA;
3070         err_mask = ata_exec_internal(dev, &tf, NULL, DMA_NONE, NULL, 0, 0);
3071         if (park && (err_mask || tf.lbal != 0xc4)) {
3072                 ata_dev_err(dev, "head unload failed!\n");
3073                 ehc->unloaded_mask &= ~(1 << dev->devno);
3074         }
3075 }
3076
3077 static int ata_eh_revalidate_and_attach(struct ata_link *link,
3078                                         struct ata_device **r_failed_dev)
3079 {
3080         struct ata_port *ap = link->ap;
3081         struct ata_eh_context *ehc = &link->eh_context;
3082         struct ata_device *dev;
3083         unsigned int new_mask = 0;
3084         unsigned long flags;
3085         int rc = 0;
3086
3087         DPRINTK("ENTER\n");
3088
3089         /* For PATA drive side cable detection to work, IDENTIFY must
3090          * be done backwards such that PDIAG- is released by the slave
3091          * device before the master device is identified.
3092          */
3093         ata_for_each_dev(dev, link, ALL_REVERSE) {
3094                 unsigned int action = ata_eh_dev_action(dev);
3095                 unsigned int readid_flags = 0;
3096
3097                 if (ehc->i.flags & ATA_EHI_DID_RESET)
3098                         readid_flags |= ATA_READID_POSTRESET;
3099
3100                 if ((action & ATA_EH_REVALIDATE) && ata_dev_enabled(dev)) {
3101                         WARN_ON(dev->class == ATA_DEV_PMP);
3102
3103                         if (ata_phys_link_offline(ata_dev_phys_link(dev))) {
3104                                 rc = -EIO;
3105                                 goto err;
3106                         }
3107
3108                         ata_eh_about_to_do(link, dev, ATA_EH_REVALIDATE);
3109                         rc = ata_dev_revalidate(dev, ehc->classes[dev->devno],
3110                                                 readid_flags);
3111                         if (rc)
3112                                 goto err;
3113
3114                         ata_eh_done(link, dev, ATA_EH_REVALIDATE);
3115
3116                         /* Configuration may have changed, reconfigure
3117                          * transfer mode.
3118                          */
3119                         ehc->i.flags |= ATA_EHI_SETMODE;
3120
3121                         /* schedule the scsi_rescan_device() here */
3122                         schedule_work(&(ap->scsi_rescan_task));
3123                 } else if (dev->class == ATA_DEV_UNKNOWN &&
3124                            ehc->tries[dev->devno] &&
3125                            ata_class_enabled(ehc->classes[dev->devno])) {
3126                         /* Temporarily set dev->class, it will be
3127                          * permanently set once all configurations are
3128                          * complete.  This is necessary because new
3129                          * device configuration is done in two
3130                          * separate loops.
3131                          */
3132                         dev->class = ehc->classes[dev->devno];
3133
3134                         if (dev->class == ATA_DEV_PMP)
3135                                 rc = sata_pmp_attach(dev);
3136                         else
3137                                 rc = ata_dev_read_id(dev, &dev->class,
3138                                                      readid_flags, dev->id);
3139
3140                         /* read_id might have changed class, store and reset */
3141                         ehc->classes[dev->devno] = dev->class;
3142                         dev->class = ATA_DEV_UNKNOWN;
3143
3144                         switch (rc) {
3145                         case 0:
3146                                 /* clear error info accumulated during probe */
3147                                 ata_ering_clear(&dev->ering);
3148                                 new_mask |= 1 << dev->devno;
3149                                 break;
3150                         case -ENOENT:
3151                                 /* IDENTIFY was issued to non-existent
3152                                  * device.  No need to reset.  Just
3153                                  * thaw and ignore the device.
3154                                  */
3155                                 ata_eh_thaw_port(ap);
3156                                 break;
3157                         default:
3158                                 goto err;
3159                         }
3160                 }
3161         }
3162
3163         /* PDIAG- should have been released, ask cable type if post-reset */
3164         if ((ehc->i.flags & ATA_EHI_DID_RESET) && ata_is_host_link(link)) {
3165                 if (ap->ops->cable_detect)
3166                         ap->cbl = ap->ops->cable_detect(ap);
3167                 ata_force_cbl(ap);
3168         }
3169
3170         /* Configure new devices forward such that user doesn't see
3171          * device detection messages backwards.
3172          */
3173         ata_for_each_dev(dev, link, ALL) {
3174                 if (!(new_mask & (1 << dev->devno)))
3175                         continue;
3176
3177                 dev->class = ehc->classes[dev->devno];
3178
3179                 if (dev->class == ATA_DEV_PMP)
3180                         continue;
3181
3182                 ehc->i.flags |= ATA_EHI_PRINTINFO;
3183                 rc = ata_dev_configure(dev);
3184                 ehc->i.flags &= ~ATA_EHI_PRINTINFO;
3185                 if (rc) {
3186                         dev->class = ATA_DEV_UNKNOWN;
3187                         goto err;
3188                 }
3189
3190                 spin_lock_irqsave(ap->lock, flags);
3191                 ap->pflags |= ATA_PFLAG_SCSI_HOTPLUG;
3192                 spin_unlock_irqrestore(ap->lock, flags);
3193
3194                 /* new device discovered, configure xfermode */
3195                 ehc->i.flags |= ATA_EHI_SETMODE;
3196         }
3197
3198         return 0;
3199
3200  err:
3201         *r_failed_dev = dev;
3202         DPRINTK("EXIT rc=%d\n", rc);
3203         return rc;
3204 }
3205
3206 /**
3207  *      ata_set_mode - Program timings and issue SET FEATURES - XFER
3208  *      @link: link on which timings will be programmed
3209  *      @r_failed_dev: out parameter for failed device
3210  *
3211  *      Set ATA device disk transfer mode (PIO3, UDMA6, etc.).  If
3212  *      ata_set_mode() fails, pointer to the failing device is
3213  *      returned in @r_failed_dev.
3214  *
3215  *      LOCKING:
3216  *      PCI/etc. bus probe sem.
3217  *
3218  *      RETURNS:
3219  *      0 on success, negative errno otherwise
3220  */
3221 int ata_set_mode(struct ata_link *link, struct ata_device **r_failed_dev)
3222 {
3223         struct ata_port *ap = link->ap;
3224         struct ata_device *dev;
3225         int rc;
3226
3227         /* if data transfer is verified, clear DUBIOUS_XFER on ering top */
3228         ata_for_each_dev(dev, link, ENABLED) {
3229                 if (!(dev->flags & ATA_DFLAG_DUBIOUS_XFER)) {
3230                         struct ata_ering_entry *ent;
3231
3232                         ent = ata_ering_top(&dev->ering);
3233                         if (ent)
3234                                 ent->eflags &= ~ATA_EFLAG_DUBIOUS_XFER;
3235                 }
3236         }
3237
3238         /* has private set_mode? */
3239         if (ap->ops->set_mode)
3240                 rc = ap->ops->set_mode(link, r_failed_dev);
3241         else
3242                 rc = ata_do_set_mode(link, r_failed_dev);
3243
3244         /* if transfer mode has changed, set DUBIOUS_XFER on device */
3245         ata_for_each_dev(dev, link, ENABLED) {
3246                 struct ata_eh_context *ehc = &link->eh_context;
3247                 u8 saved_xfer_mode = ehc->saved_xfer_mode[dev->devno];
3248                 u8 saved_ncq = !!(ehc->saved_ncq_enabled & (1 << dev->devno));
3249
3250                 if (dev->xfer_mode != saved_xfer_mode ||
3251                     ata_ncq_enabled(dev) != saved_ncq)
3252                         dev->flags |= ATA_DFLAG_DUBIOUS_XFER;
3253         }
3254
3255         return rc;
3256 }
3257
3258 /**
3259  *      atapi_eh_clear_ua - Clear ATAPI UNIT ATTENTION after reset
3260  *      @dev: ATAPI device to clear UA for
3261  *
3262  *      Resets and other operations can make an ATAPI device raise
3263  *      UNIT ATTENTION which causes the next operation to fail.  This
3264  *      function clears UA.
3265  *
3266  *      LOCKING:
3267  *      EH context (may sleep).
3268  *
3269  *      RETURNS:
3270  *      0 on success, -errno on failure.
3271  */
3272 static int atapi_eh_clear_ua(struct ata_device *dev)
3273 {
3274         int i;
3275
3276         for (i = 0; i < ATA_EH_UA_TRIES; i++) {
3277                 u8 *sense_buffer = dev->link->ap->sector_buf;
3278                 u8 sense_key = 0;
3279                 unsigned int err_mask;
3280
3281                 err_mask = atapi_eh_tur(dev, &sense_key);
3282                 if (err_mask != 0 && err_mask != AC_ERR_DEV) {
3283                         ata_dev_warn(dev,
3284                                      "TEST_UNIT_READY failed (err_mask=0x%x)\n",
3285                                      err_mask);
3286                         return -EIO;
3287                 }
3288
3289                 if (!err_mask || sense_key != UNIT_ATTENTION)
3290                         return 0;
3291
3292                 err_mask = atapi_eh_request_sense(dev, sense_buffer, sense_key);
3293                 if (err_mask) {
3294                         ata_dev_warn(dev, "failed to clear "
3295                                 "UNIT ATTENTION (err_mask=0x%x)\n", err_mask);
3296                         return -EIO;
3297                 }
3298         }
3299
3300         ata_dev_warn(dev, "UNIT ATTENTION persists after %d tries\n",
3301                      ATA_EH_UA_TRIES);
3302
3303         return 0;
3304 }
3305
3306 /**
3307  *      ata_eh_maybe_retry_flush - Retry FLUSH if necessary
3308  *      @dev: ATA device which may need FLUSH retry
3309  *
3310  *      If @dev failed FLUSH, it needs to be reported upper layer
3311  *      immediately as it means that @dev failed to remap and already
3312  *      lost at least a sector and further FLUSH retrials won't make
3313  *      any difference to the lost sector.  However, if FLUSH failed
3314  *      for other reasons, for example transmission error, FLUSH needs
3315  *      to be retried.
3316  *
3317  *      This function determines whether FLUSH failure retry is
3318  *      necessary and performs it if so.
3319  *
3320  *      RETURNS:
3321  *      0 if EH can continue, -errno if EH needs to be repeated.
3322  */
3323 static int ata_eh_maybe_retry_flush(struct ata_device *dev)
3324 {
3325         struct ata_link *link = dev->link;
3326         struct ata_port *ap = link->ap;
3327         struct ata_queued_cmd *qc;
3328         struct ata_taskfile tf;
3329         unsigned int err_mask;
3330         int rc = 0;
3331
3332         /* did flush fail for this device? */
3333         if (!ata_tag_valid(link->active_tag))
3334                 return 0;
3335
3336         qc = __ata_qc_from_tag(ap, link->active_tag);
3337         if (qc->dev != dev || (qc->tf.command != ATA_CMD_FLUSH_EXT &&
3338                                qc->tf.command != ATA_CMD_FLUSH))
3339                 return 0;
3340
3341         /* if the device failed it, it should be reported to upper layers */
3342         if (qc->err_mask & AC_ERR_DEV)
3343                 return 0;
3344
3345         /* flush failed for some other reason, give it another shot */
3346         ata_tf_init(dev, &tf);
3347
3348         tf.command = qc->tf.command;
3349         tf.flags |= ATA_TFLAG_DEVICE;
3350         tf.protocol = ATA_PROT_NODATA;
3351
3352         ata_dev_warn(dev, "retrying FLUSH 0x%x Emask 0x%x\n",
3353                        tf.command, qc->err_mask);
3354
3355         err_mask = ata_exec_internal(dev, &tf, NULL, DMA_NONE, NULL, 0, 0);
3356         if (!err_mask) {
3357                 /*
3358                  * FLUSH is complete but there's no way to
3359                  * successfully complete a failed command from EH.
3360                  * Making sure retry is allowed at least once and
3361                  * retrying it should do the trick - whatever was in
3362                  * the cache is already on the platter and this won't
3363                  * cause infinite loop.
3364                  */
3365                 qc->scsicmd->allowed = max(qc->scsicmd->allowed, 1);
3366         } else {
3367                 ata_dev_warn(dev, "FLUSH failed Emask 0x%x\n",
3368                                err_mask);
3369                 rc = -EIO;
3370
3371                 /* if device failed it, report it to upper layers */
3372                 if (err_mask & AC_ERR_DEV) {
3373                         qc->err_mask |= AC_ERR_DEV;
3374                         qc->result_tf = tf;
3375                         if (!(ap->pflags & ATA_PFLAG_FROZEN))
3376                                 rc = 0;
3377                 }
3378         }
3379         return rc;
3380 }
3381
3382 /**
3383  *      ata_eh_set_lpm - configure SATA interface power management
3384  *      @link: link to configure power management
3385  *      @policy: the link power management policy
3386  *      @r_failed_dev: out parameter for failed device
3387  *
3388  *      Enable SATA Interface power management.  This will enable
3389  *      Device Interface Power Management (DIPM) for min_power
3390  *      policy, and then call driver specific callbacks for
3391  *      enabling Host Initiated Power management.
3392  *
3393  *      LOCKING:
3394  *      EH context.
3395  *
3396  *      RETURNS:
3397  *      0 on success, -errno on failure.
3398  */
3399 static int ata_eh_set_lpm(struct ata_link *link, enum ata_lpm_policy policy,
3400                           struct ata_device **r_failed_dev)
3401 {
3402         struct ata_port *ap = ata_is_host_link(link) ? link->ap : NULL;
3403         struct ata_eh_context *ehc = &link->eh_context;
3404         struct ata_device *dev, *link_dev = NULL, *lpm_dev = NULL;
3405         enum ata_lpm_policy old_policy = link->lpm_policy;
3406         bool no_dipm = link->ap->flags & ATA_FLAG_NO_DIPM;
3407         unsigned int hints = ATA_LPM_EMPTY | ATA_LPM_HIPM;
3408         unsigned int err_mask;
3409         int rc;
3410
3411         /* if the link or host doesn't do LPM, noop */
3412         if ((link->flags & ATA_LFLAG_NO_LPM) || (ap && !ap->ops->set_lpm))
3413                 return 0;
3414
3415         /*
3416          * DIPM is enabled only for MIN_POWER as some devices
3417          * misbehave when the host NACKs transition to SLUMBER.  Order
3418          * device and link configurations such that the host always
3419          * allows DIPM requests.
3420          */
3421         ata_for_each_dev(dev, link, ENABLED) {
3422                 bool hipm = ata_id_has_hipm(dev->id);
3423                 bool dipm = ata_id_has_dipm(dev->id) && !no_dipm;
3424
3425                 /* find the first enabled and LPM enabled devices */
3426                 if (!link_dev)
3427                         link_dev = dev;
3428
3429                 if (!lpm_dev && (hipm || dipm))
3430                         lpm_dev = dev;
3431
3432                 hints &= ~ATA_LPM_EMPTY;
3433                 if (!hipm)
3434                         hints &= ~ATA_LPM_HIPM;
3435
3436                 /* disable DIPM before changing link config */
3437                 if (policy != ATA_LPM_MIN_POWER && dipm) {
3438                         err_mask = ata_dev_set_feature(dev,
3439                                         SETFEATURES_SATA_DISABLE, SATA_DIPM);
3440                         if (err_mask && err_mask != AC_ERR_DEV) {
3441                                 ata_dev_warn(dev,
3442                                              "failed to disable DIPM, Emask 0x%x\n",
3443                                              err_mask);
3444                                 rc = -EIO;
3445                                 goto fail;
3446                         }
3447                 }
3448         }
3449
3450         if (ap) {
3451                 rc = ap->ops->set_lpm(link, policy, hints);
3452                 if (!rc && ap->slave_link)
3453                         rc = ap->ops->set_lpm(ap->slave_link, policy, hints);
3454         } else
3455                 rc = sata_pmp_set_lpm(link, policy, hints);
3456
3457         /*
3458          * Attribute link config failure to the first (LPM) enabled
3459          * device on the link.
3460          */
3461         if (rc) {
3462                 if (rc == -EOPNOTSUPP) {
3463                         link->flags |= ATA_LFLAG_NO_LPM;
3464                         return 0;
3465                 }
3466                 dev = lpm_dev ? lpm_dev : link_dev;
3467                 goto fail;
3468         }
3469
3470         /*
3471          * Low level driver acked the transition.  Issue DIPM command
3472          * with the new policy set.
3473          */
3474         link->lpm_policy = policy;
3475         if (ap && ap->slave_link)
3476                 ap->slave_link->lpm_policy = policy;
3477
3478         /* host config updated, enable DIPM if transitioning to MIN_POWER */
3479         ata_for_each_dev(dev, link, ENABLED) {
3480                 if (policy == ATA_LPM_MIN_POWER && !no_dipm &&
3481                     ata_id_has_dipm(dev->id)) {
3482                         err_mask = ata_dev_set_feature(dev,
3483                                         SETFEATURES_SATA_ENABLE, SATA_DIPM);
3484                         if (err_mask && err_mask != AC_ERR_DEV) {
3485                                 ata_dev_warn(dev,
3486                                         "failed to enable DIPM, Emask 0x%x\n",
3487                                         err_mask);
3488                                 rc = -EIO;
3489                                 goto fail;
3490                         }
3491                 }
3492         }
3493
3494         return 0;
3495
3496 fail:
3497         /* restore the old policy */
3498         link->lpm_policy = old_policy;
3499         if (ap && ap->slave_link)
3500                 ap->slave_link->lpm_policy = old_policy;
3501
3502         /* if no device or only one more chance is left, disable LPM */
3503         if (!dev || ehc->tries[dev->devno] <= 2) {
3504                 ata_link_warn(link, "disabling LPM on the link\n");
3505                 link->flags |= ATA_LFLAG_NO_LPM;
3506         }
3507         if (r_failed_dev)
3508                 *r_failed_dev = dev;
3509         return rc;
3510 }
3511
3512 int ata_link_nr_enabled(struct ata_link *link)
3513 {
3514         struct ata_device *dev;
3515         int cnt = 0;
3516
3517         ata_for_each_dev(dev, link, ENABLED)
3518                 cnt++;
3519         return cnt;
3520 }
3521
3522 static int ata_link_nr_vacant(struct ata_link *link)
3523 {
3524         struct ata_device *dev;
3525         int cnt = 0;
3526
3527         ata_for_each_dev(dev, link, ALL)
3528                 if (dev->class == ATA_DEV_UNKNOWN)
3529                         cnt++;
3530         return cnt;
3531 }
3532
3533 static int ata_eh_skip_recovery(struct ata_link *link)
3534 {
3535         struct ata_port *ap = link->ap;
3536         struct ata_eh_context *ehc = &link->eh_context;
3537         struct ata_device *dev;
3538
3539         /* skip disabled links */
3540         if (link->flags & ATA_LFLAG_DISABLED)
3541                 return 1;
3542
3543         /* skip if explicitly requested */
3544         if (ehc->i.flags & ATA_EHI_NO_RECOVERY)
3545                 return 1;
3546
3547         /* thaw frozen port and recover failed devices */
3548         if ((ap->pflags & ATA_PFLAG_FROZEN) || ata_link_nr_enabled(link))
3549                 return 0;
3550
3551         /* reset at least once if reset is requested */
3552         if ((ehc->i.action & ATA_EH_RESET) &&
3553             !(ehc->i.flags & ATA_EHI_DID_RESET))
3554                 return 0;
3555
3556         /* skip if class codes for all vacant slots are ATA_DEV_NONE */
3557         ata_for_each_dev(dev, link, ALL) {
3558                 if (dev->class == ATA_DEV_UNKNOWN &&
3559                     ehc->classes[dev->devno] != ATA_DEV_NONE)
3560                         return 0;
3561         }
3562
3563         return 1;
3564 }
3565
3566 static int ata_count_probe_trials_cb(struct ata_ering_entry *ent, void *void_arg)
3567 {
3568         u64 interval = msecs_to_jiffies(ATA_EH_PROBE_TRIAL_INTERVAL);
3569         u64 now = get_jiffies_64();
3570         int *trials = void_arg;
3571
3572         if ((ent->eflags & ATA_EFLAG_OLD_ER) ||
3573             (ent->timestamp < now - min(now, interval)))
3574                 return -1;
3575
3576         (*trials)++;
3577         return 0;
3578 }
3579
3580 static int ata_eh_schedule_probe(struct ata_device *dev)
3581 {
3582         struct ata_eh_context *ehc = &dev->link->eh_context;
3583         struct ata_link *link = ata_dev_phys_link(dev);
3584         int trials = 0;
3585
3586         if (!(ehc->i.probe_mask & (1 << dev->devno)) ||
3587             (ehc->did_probe_mask & (1 << dev->devno)))
3588                 return 0;
3589
3590         ata_eh_detach_dev(dev);
3591         ata_dev_init(dev);
3592         ehc->did_probe_mask |= (1 << dev->devno);
3593         ehc->i.action |= ATA_EH_RESET;
3594         ehc->saved_xfer_mode[dev->devno] = 0;
3595         ehc->saved_ncq_enabled &= ~(1 << dev->devno);
3596
3597         /* the link maybe in a deep sleep, wake it up */
3598         if (link->lpm_policy > ATA_LPM_MAX_POWER) {
3599                 if (ata_is_host_link(link))
3600                         link->ap->ops->set_lpm(link, ATA_LPM_MAX_POWER,
3601                                                ATA_LPM_EMPTY);
3602                 else
3603                         sata_pmp_set_lpm(link, ATA_LPM_MAX_POWER,
3604                                          ATA_LPM_EMPTY);
3605         }
3606
3607         /* Record and count probe trials on the ering.  The specific
3608          * error mask used is irrelevant.  Because a successful device
3609          * detection clears the ering, this count accumulates only if
3610          * there are consecutive failed probes.
3611          *
3612          * If the count is equal to or higher than ATA_EH_PROBE_TRIALS
3613          * in the last ATA_EH_PROBE_TRIAL_INTERVAL, link speed is
3614          * forced to 1.5Gbps.
3615          *
3616          * This is to work around cases where failed link speed
3617          * negotiation results in device misdetection leading to
3618          * infinite DEVXCHG or PHRDY CHG events.
3619          */
3620         ata_ering_record(&dev->ering, 0, AC_ERR_OTHER);
3621         ata_ering_map(&dev->ering, ata_count_probe_trials_cb, &trials);
3622
3623         if (trials > ATA_EH_PROBE_TRIALS)
3624                 sata_down_spd_limit(link, 1);
3625
3626         return 1;
3627 }
3628
3629 static int ata_eh_handle_dev_fail(struct ata_device *dev, int err)
3630 {
3631         struct ata_eh_context *ehc = &dev->link->eh_context;
3632
3633         /* -EAGAIN from EH routine indicates retry without prejudice.
3634          * The requester is responsible for ensuring forward progress.
3635          */
3636         if (err != -EAGAIN)
3637                 ehc->tries[dev->devno]--;
3638
3639         switch (err) {
3640         case -ENODEV:
3641                 /* device missing or wrong IDENTIFY data, schedule probing */
3642                 ehc->i.probe_mask |= (1 << dev->devno);
3643         case -EINVAL:
3644                 /* give it just one more chance */
3645                 ehc->tries[dev->devno] = min(ehc->tries[dev->devno], 1);
3646         case -EIO:
3647                 if (ehc->tries[dev->devno] == 1) {
3648                         /* This is the last chance, better to slow
3649                          * down than lose it.
3650                          */
3651                         sata_down_spd_limit(ata_dev_phys_link(dev), 0);
3652                         if (dev->pio_mode > XFER_PIO_0)
3653                                 ata_down_xfermask_limit(dev, ATA_DNXFER_PIO);
3654                 }
3655         }
3656
3657         if (ata_dev_enabled(dev) && !ehc->tries[dev->devno]) {
3658                 /* disable device if it has used up all its chances */
3659                 ata_dev_disable(dev);
3660
3661                 /* detach if offline */
3662                 if (ata_phys_link_offline(ata_dev_phys_link(dev)))
3663                         ata_eh_detach_dev(dev);
3664
3665                 /* schedule probe if necessary */
3666                 if (ata_eh_schedule_probe(dev)) {
3667                         ehc->tries[dev->devno] = ATA_EH_DEV_TRIES;
3668                         memset(ehc->cmd_timeout_idx[dev->devno], 0,
3669                                sizeof(ehc->cmd_timeout_idx[dev->devno]));
3670                 }
3671
3672                 return 1;
3673         } else {
3674                 ehc->i.action |= ATA_EH_RESET;
3675                 return 0;
3676         }
3677 }
3678
3679 /**
3680  *      ata_eh_recover - recover host port after error
3681  *      @ap: host port to recover
3682  *      @prereset: prereset method (can be NULL)
3683  *      @softreset: softreset method (can be NULL)
3684  *      @hardreset: hardreset method (can be NULL)
3685  *      @postreset: postreset method (can be NULL)
3686  *      @r_failed_link: out parameter for failed link
3687  *
3688  *      This is the alpha and omega, eum and yang, heart and soul of
3689  *      libata exception handling.  On entry, actions required to
3690  *      recover each link and hotplug requests are recorded in the
3691  *      link's eh_context.  This function executes all the operations
3692  *      with appropriate retrials and fallbacks to resurrect failed
3693  *      devices, detach goners and greet newcomers.
3694  *
3695  *      LOCKING:
3696  *      Kernel thread context (may sleep).
3697  *
3698  *      RETURNS:
3699  *      0 on success, -errno on failure.
3700  */
3701 int ata_eh_recover(struct ata_port *ap, ata_prereset_fn_t prereset,
3702                    ata_reset_fn_t softreset, ata_reset_fn_t hardreset,
3703                    ata_postreset_fn_t postreset,
3704                    struct ata_link **r_failed_link)
3705 {
3706         struct ata_link *link;
3707         struct ata_device *dev;
3708         int rc, nr_fails;
3709         unsigned long flags, deadline;
3710
3711         DPRINTK("ENTER\n");
3712
3713         /* prep for recovery */
3714         ata_for_each_link(link, ap, EDGE) {
3715                 struct ata_eh_context *ehc = &link->eh_context;
3716
3717                 /* re-enable link? */
3718                 if (ehc->i.action & ATA_EH_ENABLE_LINK) {
3719                         ata_eh_about_to_do(link, NULL, ATA_EH_ENABLE_LINK);
3720                         spin_lock_irqsave(ap->lock, flags);
3721                         link->flags &= ~ATA_LFLAG_DISABLED;
3722                         spin_unlock_irqrestore(ap->lock, flags);
3723                         ata_eh_done(link, NULL, ATA_EH_ENABLE_LINK);
3724                 }
3725
3726                 ata_for_each_dev(dev, link, ALL) {
3727                         if (link->flags & ATA_LFLAG_NO_RETRY)
3728                                 ehc->tries[dev->devno] = 1;
3729                         else
3730                                 ehc->tries[dev->devno] = ATA_EH_DEV_TRIES;
3731
3732                         /* collect port action mask recorded in dev actions */
3733                         ehc->i.action |= ehc->i.dev_action[dev->devno] &
3734                                          ~ATA_EH_PERDEV_MASK;
3735                         ehc->i.dev_action[dev->devno] &= ATA_EH_PERDEV_MASK;
3736
3737                         /* process hotplug request */
3738                         if (dev->flags & ATA_DFLAG_DETACH)
3739                                 ata_eh_detach_dev(dev);
3740
3741                         /* schedule probe if necessary */
3742                         if (!ata_dev_enabled(dev))
3743                                 ata_eh_schedule_probe(dev);
3744                 }
3745         }
3746
3747  retry:
3748         rc = 0;
3749
3750         /* if UNLOADING, finish immediately */
3751         if (ap->pflags & ATA_PFLAG_UNLOADING)
3752                 goto out;
3753
3754         /* prep for EH */
3755         ata_for_each_link(link, ap, EDGE) {
3756                 struct ata_eh_context *ehc = &link->eh_context;
3757
3758                 /* skip EH if possible. */
3759                 if (ata_eh_skip_recovery(link))
3760                         ehc->i.action = 0;
3761
3762                 ata_for_each_dev(dev, link, ALL)
3763                         ehc->classes[dev->devno] = ATA_DEV_UNKNOWN;
3764         }
3765
3766         /* reset */
3767         ata_for_each_link(link, ap, EDGE) {
3768                 struct ata_eh_context *ehc = &link->eh_context;
3769
3770                 if (!(ehc->i.action & ATA_EH_RESET))
3771                         continue;
3772
3773                 rc = ata_eh_reset(link, ata_link_nr_vacant(link),
3774                                   prereset, softreset, hardreset, postreset);
3775                 if (rc) {
3776                         ata_link_err(link, "reset failed, giving up\n");
3777                         goto out;
3778                 }
3779         }
3780
3781         do {
3782                 unsigned long now;
3783
3784                 /*
3785                  * clears ATA_EH_PARK in eh_info and resets
3786                  * ap->park_req_pending
3787                  */
3788                 ata_eh_pull_park_action(ap);
3789
3790                 deadline = jiffies;
3791                 ata_for_each_link(link, ap, EDGE) {
3792                         ata_for_each_dev(dev, link, ALL) {
3793                                 struct ata_eh_context *ehc = &link->eh_context;
3794                                 unsigned long tmp;
3795
3796                                 if (dev->class != ATA_DEV_ATA &&
3797                                     dev->class != ATA_DEV_ZAC)
3798                                         continue;
3799                                 if (!(ehc->i.dev_action[dev->devno] &
3800                                       ATA_EH_PARK))
3801                                         continue;
3802                                 tmp = dev->unpark_deadline;
3803                                 if (time_before(deadline, tmp))
3804                                         deadline = tmp;
3805                                 else if (time_before_eq(tmp, jiffies))
3806                                         continue;
3807                                 if (ehc->unloaded_mask & (1 << dev->devno))
3808                                         continue;
3809
3810                                 ata_eh_park_issue_cmd(dev, 1);
3811                         }
3812                 }
3813
3814                 now = jiffies;
3815                 if (time_before_eq(deadline, now))
3816                         break;
3817
3818                 ata_eh_release(ap);
3819                 deadline = wait_for_completion_timeout(&ap->park_req_pending,
3820                                                        deadline - now);
3821                 ata_eh_acquire(ap);
3822         } while (deadline);
3823         ata_for_each_link(link, ap, EDGE) {
3824                 ata_for_each_dev(dev, link, ALL) {
3825                         if (!(link->eh_context.unloaded_mask &
3826                               (1 << dev->devno)))
3827                                 continue;
3828
3829                         ata_eh_park_issue_cmd(dev, 0);
3830                         ata_eh_done(link, dev, ATA_EH_PARK);
3831                 }
3832         }
3833
3834         /* the rest */
3835         nr_fails = 0;
3836         ata_for_each_link(link, ap, PMP_FIRST) {
3837                 struct ata_eh_context *ehc = &link->eh_context;
3838
3839                 if (sata_pmp_attached(ap) && ata_is_host_link(link))
3840                         goto config_lpm;
3841
3842                 /* revalidate existing devices and attach new ones */
3843                 rc = ata_eh_revalidate_and_attach(link, &dev);
3844                 if (rc)
3845                         goto rest_fail;
3846
3847                 /* if PMP got attached, return, pmp EH will take care of it */
3848                 if (link->device->class == ATA_DEV_PMP) {
3849                         ehc->i.action = 0;
3850                         return 0;
3851                 }
3852
3853                 /* configure transfer mode if necessary */
3854                 if (ehc->i.flags & ATA_EHI_SETMODE) {
3855                         rc = ata_set_mode(link, &dev);
3856                         if (rc)
3857                                 goto rest_fail;
3858                         ehc->i.flags &= ~ATA_EHI_SETMODE;
3859                 }
3860
3861                 /* If reset has been issued, clear UA to avoid
3862                  * disrupting the current users of the device.
3863                  */
3864                 if (ehc->i.flags & ATA_EHI_DID_RESET) {
3865                         ata_for_each_dev(dev, link, ALL) {
3866                                 if (dev->class != ATA_DEV_ATAPI)
3867                                         continue;
3868                                 rc = atapi_eh_clear_ua(dev);
3869                                 if (rc)
3870                                         goto rest_fail;
3871                                 if (zpodd_dev_enabled(dev))
3872                                         zpodd_post_poweron(dev);
3873                         }
3874                 }
3875
3876                 /* retry flush if necessary */
3877                 ata_for_each_dev(dev, link, ALL) {
3878                         if (dev->class != ATA_DEV_ATA &&
3879                             dev->class != ATA_DEV_ZAC)
3880                                 continue;
3881                         rc = ata_eh_maybe_retry_flush(dev);
3882                         if (rc)
3883                                 goto rest_fail;
3884                 }
3885
3886         config_lpm:
3887                 /* configure link power saving */
3888                 if (link->lpm_policy != ap->target_lpm_policy) {
3889                         rc = ata_eh_set_lpm(link, ap->target_lpm_policy, &dev);
3890                         if (rc)
3891                                 goto rest_fail;
3892                 }
3893
3894                 /* this link is okay now */
3895                 ehc->i.flags = 0;
3896                 continue;
3897
3898         rest_fail:
3899                 nr_fails++;
3900                 if (dev)
3901                         ata_eh_handle_dev_fail(dev, rc);
3902
3903                 if (ap->pflags & ATA_PFLAG_FROZEN) {
3904                         /* PMP reset requires working host port.
3905                          * Can't retry if it's frozen.
3906                          */
3907                         if (sata_pmp_attached(ap))
3908                                 goto out;
3909                         break;
3910                 }
3911         }
3912
3913         if (nr_fails)
3914                 goto retry;
3915
3916  out:
3917         if (rc && r_failed_link)
3918                 *r_failed_link = link;
3919
3920         DPRINTK("EXIT, rc=%d\n", rc);
3921         return rc;
3922 }
3923
3924 /**
3925  *      ata_eh_finish - finish up EH
3926  *      @ap: host port to finish EH for
3927  *
3928  *      Recovery is complete.  Clean up EH states and retry or finish
3929  *      failed qcs.
3930  *
3931  *      LOCKING:
3932  *      None.
3933  */
3934 void ata_eh_finish(struct ata_port *ap)
3935 {
3936         int tag;
3937
3938         /* retry or finish qcs */
3939         for (tag = 0; tag < ATA_MAX_QUEUE; tag++) {
3940                 struct ata_queued_cmd *qc = __ata_qc_from_tag(ap, tag);
3941
3942                 if (!(qc->flags & ATA_QCFLAG_FAILED))
3943                         continue;
3944
3945                 if (qc->err_mask) {
3946                         /* FIXME: Once EH migration is complete,
3947                          * generate sense data in this function,
3948                          * considering both err_mask and tf.
3949                          */
3950                         if (qc->flags & ATA_QCFLAG_RETRY)
3951                                 ata_eh_qc_retry(qc);
3952                         else
3953                                 ata_eh_qc_complete(qc);
3954                 } else {
3955                         if (qc->flags & ATA_QCFLAG_SENSE_VALID) {
3956                                 ata_eh_qc_complete(qc);
3957                         } else {
3958                                 /* feed zero TF to sense generation */
3959                                 memset(&qc->result_tf, 0, sizeof(qc->result_tf));
3960                                 ata_eh_qc_retry(qc);
3961                         }
3962                 }
3963         }
3964
3965         /* make sure nr_active_links is zero after EH */
3966         WARN_ON(ap->nr_active_links);
3967         ap->nr_active_links = 0;
3968 }
3969
3970 /**
3971  *      ata_do_eh - do standard error handling
3972  *      @ap: host port to handle error for
3973  *
3974  *      @prereset: prereset method (can be NULL)
3975  *      @softreset: softreset method (can be NULL)
3976  *      @hardreset: hardreset method (can be NULL)
3977  *      @postreset: postreset method (can be NULL)
3978  *
3979  *      Perform standard error handling sequence.
3980  *
3981  *      LOCKING:
3982  *      Kernel thread context (may sleep).
3983  */
3984 void ata_do_eh(struct ata_port *ap, ata_prereset_fn_t prereset,
3985                ata_reset_fn_t softreset, ata_reset_fn_t hardreset,
3986                ata_postreset_fn_t postreset)
3987 {
3988         struct ata_device *dev;
3989         int rc;
3990
3991         ata_eh_autopsy(ap);
3992         ata_eh_report(ap);
3993
3994         rc = ata_eh_recover(ap, prereset, softreset, hardreset, postreset,
3995                             NULL);
3996         if (rc) {
3997                 ata_for_each_dev(dev, &ap->link, ALL)
3998                         ata_dev_disable(dev);
3999         }
4000
4001         ata_eh_finish(ap);
4002 }
4003
4004 /**
4005  *      ata_std_error_handler - standard error handler
4006  *      @ap: host port to handle error for
4007  *
4008  *      Standard error handler
4009  *
4010  *      LOCKING:
4011  *      Kernel thread context (may sleep).
4012  */
4013 void ata_std_error_handler(struct ata_port *ap)
4014 {
4015         struct ata_port_operations *ops = ap->ops;
4016         ata_reset_fn_t hardreset = ops->hardreset;
4017
4018         /* ignore built-in hardreset if SCR access is not available */
4019         if (hardreset == sata_std_hardreset && !sata_scr_valid(&ap->link))
4020                 hardreset = NULL;
4021
4022         ata_do_eh(ap, ops->prereset, ops->softreset, hardreset, ops->postreset);
4023 }
4024
4025 #ifdef CONFIG_PM
4026 /**
4027  *      ata_eh_handle_port_suspend - perform port suspend operation
4028  *      @ap: port to suspend
4029  *
4030  *      Suspend @ap.
4031  *
4032  *      LOCKING:
4033  *      Kernel thread context (may sleep).
4034  */
4035 static void ata_eh_handle_port_suspend(struct ata_port *ap)
4036 {
4037         unsigned long flags;
4038         int rc = 0;
4039         struct ata_device *dev;
4040
4041         /* are we suspending? */
4042         spin_lock_irqsave(ap->lock, flags);
4043         if (!(ap->pflags & ATA_PFLAG_PM_PENDING) ||
4044             ap->pm_mesg.event & PM_EVENT_RESUME) {
4045                 spin_unlock_irqrestore(ap->lock, flags);
4046                 return;
4047         }
4048         spin_unlock_irqrestore(ap->lock, flags);
4049
4050         WARN_ON(ap->pflags & ATA_PFLAG_SUSPENDED);
4051
4052         /*
4053          * If we have a ZPODD attached, check its zero
4054          * power ready status before the port is frozen.
4055          * Only needed for runtime suspend.
4056          */
4057         if (PMSG_IS_AUTO(ap->pm_mesg)) {
4058                 ata_for_each_dev(dev, &ap->link, ENABLED) {
4059                         if (zpodd_dev_enabled(dev))
4060                                 zpodd_on_suspend(dev);
4061                 }
4062         }
4063
4064         /* tell ACPI we're suspending */
4065         rc = ata_acpi_on_suspend(ap);
4066         if (rc)
4067                 goto out;
4068
4069         /* suspend */
4070         ata_eh_freeze_port(ap);
4071
4072         if (ap->ops->port_suspend)
4073                 rc = ap->ops->port_suspend(ap, ap->pm_mesg);
4074
4075         ata_acpi_set_state(ap, ap->pm_mesg);
4076  out:
4077         /* update the flags */
4078         spin_lock_irqsave(ap->lock, flags);
4079
4080         ap->pflags &= ~ATA_PFLAG_PM_PENDING;
4081         if (rc == 0)
4082                 ap->pflags |= ATA_PFLAG_SUSPENDED;
4083         else if (ap->pflags & ATA_PFLAG_FROZEN)
4084                 ata_port_schedule_eh(ap);
4085
4086         spin_unlock_irqrestore(ap->lock, flags);
4087
4088         return;
4089 }
4090
4091 /**
4092  *      ata_eh_handle_port_resume - perform port resume operation
4093  *      @ap: port to resume
4094  *
4095  *      Resume @ap.
4096  *
4097  *      LOCKING:
4098  *      Kernel thread context (may sleep).
4099  */
4100 static void ata_eh_handle_port_resume(struct ata_port *ap)
4101 {
4102         struct ata_link *link;
4103         struct ata_device *dev;
4104         unsigned long flags;
4105         int rc = 0;
4106
4107         /* are we resuming? */
4108         spin_lock_irqsave(ap->lock, flags);
4109         if (!(ap->pflags & ATA_PFLAG_PM_PENDING) ||
4110             !(ap->pm_mesg.event & PM_EVENT_RESUME)) {
4111                 spin_unlock_irqrestore(ap->lock, flags);
4112                 return;
4113         }
4114         spin_unlock_irqrestore(ap->lock, flags);
4115
4116         WARN_ON(!(ap->pflags & ATA_PFLAG_SUSPENDED));
4117
4118         /*
4119          * Error timestamps are in jiffies which doesn't run while
4120          * suspended and PHY events during resume isn't too uncommon.
4121          * When the two are combined, it can lead to unnecessary speed
4122          * downs if the machine is suspended and resumed repeatedly.
4123          * Clear error history.
4124          */
4125         ata_for_each_link(link, ap, HOST_FIRST)
4126                 ata_for_each_dev(dev, link, ALL)
4127                         ata_ering_clear(&dev->ering);
4128
4129         ata_acpi_set_state(ap, ap->pm_mesg);
4130
4131         if (ap->ops->port_resume)
4132                 rc = ap->ops->port_resume(ap);
4133
4134         /* tell ACPI that we're resuming */
4135         ata_acpi_on_resume(ap);
4136
4137         /* update the flags */
4138         spin_lock_irqsave(ap->lock, flags);
4139         ap->pflags &= ~(ATA_PFLAG_PM_PENDING | ATA_PFLAG_SUSPENDED);
4140         spin_unlock_irqrestore(ap->lock, flags);
4141 }
4142 #endif /* CONFIG_PM */