Whamcloud - gitweb
197ffd63f253df05417bfa3a47ca13e1eb13adee
[fs/lustre-release.git] / lustre / mdd / mdd_lov.c
1 /* -*- mode: c; c-basic-offset: 8; indent-tabs-mode: nil; -*-
2  * vim:expandtab:shiftwidth=8:tabstop=8:
3  *
4  * GPL HEADER START
5  *
6  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
7  *
8  * This program is free software; you can redistribute it and/or modify
9  * it under the terms of the GNU General Public License version 2 only,
10  * as published by the Free Software Foundation.
11  *
12  * This program is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
15  * General Public License version 2 for more details (a copy is included
16  * in the LICENSE file that accompanied this code).
17  *
18  * You should have received a copy of the GNU General Public License
19  * version 2 along with this program; If not, see
20  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
21  *
22  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
23  * CA 95054 USA or visit www.sun.com if you need additional information or
24  * have any questions.
25  *
26  * GPL HEADER END
27  */
28 /*
29  * Copyright  2008 Sun Microsystems, Inc. All rights reserved
30  * Use is subject to license terms.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/mdd/mdd_lov.c
37  *
38  * Lustre Metadata Server (mds) handling of striped file data
39  *
40  * Author: Peter Braam <braam@clusterfs.com>
41  * Author: wangdi <wangdi@clusterfs.com>
42  */
43
44 #ifndef EXPORT_SYMTAB
45 # define EXPORT_SYMTAB
46 #endif
47 #define DEBUG_SUBSYSTEM S_MDS
48
49 #include <linux/module.h>
50 #include <obd.h>
51 #include <obd_class.h>
52 #include <lustre_ver.h>
53 #include <obd_support.h>
54 #include <obd_lov.h>
55 #include <lprocfs_status.h>
56 #include <lustre_mds.h>
57 #include <lustre_fid.h>
58 #include <lustre/lustre_idl.h>
59
60 #include "mdd_internal.h"
61
62 static int mdd_notify(struct obd_device *host, struct obd_device *watched,
63                       enum obd_notify_event ev, void *owner)
64 {
65         struct mdd_device *mdd = owner;
66         int rc = 0;
67         ENTRY;
68
69         LASSERT(owner != NULL);
70         switch (ev)
71         {
72                 case OBD_NOTIFY_ACTIVE:
73                 case OBD_NOTIFY_SYNC:
74                 case OBD_NOTIFY_SYNC_NONBLOCK:
75                         rc = md_do_upcall(NULL, &mdd->mdd_md_dev, MD_LOV_SYNC);
76                         break;
77                 case OBD_NOTIFY_CONFIG:
78                         rc = md_do_upcall(NULL, &mdd->mdd_md_dev, MD_LOV_CONFIG);
79                         break;
80                 default:
81                         CDEBUG(D_INFO, "Unhandled notification %#x\n", ev);
82         }
83
84         RETURN(rc);
85 }
86
87 /* The obd is created for handling data stack for mdd */
88 int mdd_init_obd(const struct lu_env *env, struct mdd_device *mdd,
89                  struct lustre_cfg *cfg)
90 {
91         char                   *dev = lustre_cfg_string(cfg, 0);
92         int                     rc, name_size, uuid_size;
93         char                   *name, *uuid;
94         __u32                   mds_id;
95         struct lustre_cfg_bufs *bufs;
96         struct lustre_cfg      *lcfg;
97         struct obd_device      *obd;
98         ENTRY;
99
100         mds_id = lu_site2md(mdd2lu_dev(mdd)->ld_site)->ms_node_id;
101         name_size = strlen(MDD_OBD_NAME) + 35;
102         uuid_size = strlen(MDD_OBD_UUID) + 35;
103
104         OBD_ALLOC(name, name_size);
105         OBD_ALLOC(uuid, uuid_size);
106         if (name == NULL || uuid == NULL)
107                 GOTO(cleanup_mem, rc = -ENOMEM);
108
109         OBD_ALLOC_PTR(bufs);
110         if (!bufs)
111                 GOTO(cleanup_mem, rc = -ENOMEM);
112
113         snprintf(name, strlen(MDD_OBD_NAME) + 35, "%s-%s-%d",
114                  MDD_OBD_NAME, dev, mds_id);
115
116         snprintf(uuid, strlen(MDD_OBD_UUID) + 35, "%s-%s-%d",
117                  MDD_OBD_UUID, dev, mds_id);
118
119         lustre_cfg_bufs_reset(bufs, name);
120         lustre_cfg_bufs_set_string(bufs, 1, MDD_OBD_TYPE);
121         lustre_cfg_bufs_set_string(bufs, 2, uuid);
122         lustre_cfg_bufs_set_string(bufs, 3, (char*)dev/* MDD_OBD_PROFILE */);
123         lustre_cfg_bufs_set_string(bufs, 4, (char*)dev);
124
125         lcfg = lustre_cfg_new(LCFG_ATTACH, bufs);
126         OBD_FREE_PTR(bufs);
127         if (!lcfg)
128                 GOTO(cleanup_mem, rc = -ENOMEM);
129
130         rc = class_attach(lcfg);
131         if (rc)
132                 GOTO(lcfg_cleanup, rc);
133
134         obd = class_name2obd(name);
135         if (!obd) {
136                 CERROR("Can not find obd %s\n", MDD_OBD_NAME);
137                 LBUG();
138         }
139
140         obd->obd_recovering = 1;
141         obd->u.mds.mds_id = mds_id;
142         rc = class_setup(obd, lcfg);
143         if (rc)
144                 GOTO(class_detach, rc);
145
146         /*
147          * Add here for obd notify mechanism, when adding a new ost, the mds
148          * will notify this mdd. The mds will be used for quota also.
149          */
150         obd->obd_upcall.onu_upcall = mdd_notify;
151         obd->obd_upcall.onu_owner = mdd;
152         mdd->mdd_obd_dev = obd;
153         EXIT;
154 class_detach:
155         if (rc)
156                 class_detach(obd, lcfg);
157 lcfg_cleanup:
158         lustre_cfg_free(lcfg);
159 cleanup_mem:
160         if (name)
161                 OBD_FREE(name, name_size);
162         if (uuid)
163                 OBD_FREE(uuid, uuid_size);
164         return rc;
165 }
166
167 int mdd_fini_obd(const struct lu_env *env, struct mdd_device *mdd,
168                  struct lustre_cfg *lcfg)
169 {
170         struct obd_device      *obd;
171         int rc;
172         ENTRY;
173
174         obd = mdd2obd_dev(mdd);
175         LASSERT(obd);
176
177         rc = class_cleanup(obd, lcfg);
178         if (rc)
179                 GOTO(lcfg_cleanup, rc);
180
181         obd->obd_upcall.onu_upcall = NULL;
182         obd->obd_upcall.onu_owner = NULL;
183         rc = class_detach(obd, lcfg);
184         if (rc)
185                 GOTO(lcfg_cleanup, rc);
186         mdd->mdd_obd_dev = NULL;
187
188         EXIT;
189 lcfg_cleanup:
190         return rc;
191 }
192
193 int mdd_get_md(const struct lu_env *env, struct mdd_object *obj,
194                void *md, int *md_size, const char *name)
195 {
196         int rc;
197         ENTRY;
198
199         rc = mdo_xattr_get(env, obj, mdd_buf_get(env, md, *md_size), name,
200                            mdd_object_capa(env, obj));
201         /*
202          * XXX: Handling of -ENODATA, the right way is to have ->do_md_get()
203          * exported by dt layer.
204          */
205         if (rc == 0 || rc == -ENODATA) {
206                 *md_size = 0;
207                 rc = 0;
208         } else if (rc < 0) {
209                 CERROR("Error %d reading eadata - %d\n", rc, *md_size);
210         } else {
211                 /* XXX: Convert lov EA but fixed after verification test. */
212                 *md_size = rc;
213         }
214
215         RETURN(rc);
216 }
217
218 int mdd_get_md_locked(const struct lu_env *env, struct mdd_object *obj,
219                       void *md, int *md_size, const char *name)
220 {
221         int rc = 0;
222         mdd_read_lock(env, obj, MOR_TGT_CHILD);
223         rc = mdd_get_md(env, obj, md, md_size, name);
224         mdd_read_unlock(env, obj);
225         return rc;
226 }
227
228 static int mdd_lov_set_stripe_md(const struct lu_env *env,
229                                  struct mdd_object *obj, struct lu_buf *buf,
230                                  struct thandle *handle)
231 {
232         struct mdd_device       *mdd = mdo2mdd(&obj->mod_obj);
233         struct obd_device       *obd = mdd2obd_dev(mdd);
234         struct obd_export       *lov_exp = obd->u.mds.mds_osc_exp;
235         struct lov_stripe_md    *lsm = NULL;
236         int rc;
237         ENTRY;
238
239         LASSERT(S_ISDIR(mdd_object_type(obj)) || S_ISREG(mdd_object_type(obj)));
240         rc = obd_iocontrol(OBD_IOC_LOV_SETSTRIPE, lov_exp, 0,
241                            &lsm, buf->lb_buf);
242         if (rc)
243                 RETURN(rc);
244         obd_free_memmd(lov_exp, &lsm);
245
246         rc = mdd_xattr_set_txn(env, obj, buf, XATTR_NAME_LOV, 0, handle);
247
248         CDEBUG(D_INFO, "set lov ea of "DFID" rc %d \n", PFID(mdo2fid(obj)), rc);
249         RETURN(rc);
250 }
251
252 /*
253  * Permission check is done before call it,
254  * no need check again.
255  */
256 static int mdd_lov_set_dir_md(const struct lu_env *env,
257                               struct mdd_object *obj, struct lu_buf *buf,
258                               struct thandle *handle)
259 {
260         struct lov_user_md *lum = NULL;
261         int rc = 0;
262         ENTRY;
263
264         LASSERT(S_ISDIR(mdd_object_type(obj)));
265         lum = (struct lov_user_md*)buf->lb_buf;
266
267         /* if { size, offset, count } = { 0, -1, 0 } and no pool (i.e. all default
268          * values specified) then delete default striping from dir. */
269         if (lum->lmm_stripe_size == 0 && lum->lmm_stripe_count == 0 &&
270             lum->lmm_stripe_offset == (typeof(lum->lmm_stripe_offset))(-1) &&
271             lum->lmm_magic != LOV_USER_MAGIC_V3) {
272                 rc = mdd_xattr_set_txn(env, obj, &LU_BUF_NULL,
273                                        XATTR_NAME_LOV, 0, handle);
274                 if (rc == -ENODATA)
275                         rc = 0;
276                 CDEBUG(D_INFO, "delete lov ea of "DFID" rc %d \n",
277                                 PFID(mdo2fid(obj)), rc);
278         } else {
279                 rc = mdd_lov_set_stripe_md(env, obj, buf, handle);
280         }
281         RETURN(rc);
282 }
283
284 int mdd_lsm_sanity_check(const struct lu_env *env,  struct mdd_object *obj)
285 {
286         struct lu_attr   *tmp_la = &mdd_env_info(env)->mti_la;
287         struct md_ucred  *uc     = md_ucred(env);
288         int rc;
289         ENTRY;
290
291         rc = mdd_la_get(env, obj, tmp_la, BYPASS_CAPA);
292         if (rc)
293                 RETURN(rc);
294
295         if ((uc->mu_fsuid != tmp_la->la_uid) &&
296             !mdd_capable(uc, CFS_CAP_FOWNER))
297                 rc = mdd_permission_internal_locked(env, obj, tmp_la,
298                                                     MAY_WRITE, MOR_TGT_CHILD);
299
300         RETURN(rc);
301 }
302
303 int mdd_lov_set_md(const struct lu_env *env, struct mdd_object *pobj,
304                    struct mdd_object *child, struct lov_mds_md *lmmp,
305                    int lmm_size, struct thandle *handle, int set_stripe)
306 {
307         struct lu_buf *buf;
308         umode_t mode;
309         int rc = 0;
310         ENTRY;
311
312         buf = mdd_buf_get(env, lmmp, lmm_size);
313         mode = mdd_object_type(child);
314         if (S_ISREG(mode) && lmm_size > 0) {
315                 if (set_stripe) {
316                         rc = mdd_lov_set_stripe_md(env, child, buf, handle);
317                 } else {
318                         rc = mdd_xattr_set_txn(env, child, buf,
319                                                XATTR_NAME_LOV, 0, handle);
320                 }
321         } else if (S_ISDIR(mode)) {
322                 if (lmmp == NULL && lmm_size == 0) {
323                         struct mdd_device *mdd = mdd_obj2mdd_dev(child);
324                         struct lov_mds_md *lmm = mdd_max_lmm_get(env, mdd);
325                         int size = sizeof(struct lov_mds_md_v3);
326
327                         /* Get parent dir stripe and set */
328                         if (pobj != NULL)
329                                 rc = mdd_get_md_locked(env, pobj, lmm, &size,
330                                                        XATTR_NAME_LOV);
331                         if (rc > 0) {
332                                 buf = mdd_buf_get(env, lmm, size);
333                                 rc = mdd_xattr_set_txn(env, child, buf,
334                                                XATTR_NAME_LOV, 0, handle);
335                                 if (rc)
336                                         CERROR("error on copy stripe info: rc "
337                                                 "= %d\n", rc);
338                         }
339                 } else {
340                         LASSERT(lmmp != NULL && lmm_size > 0);
341                         rc = mdd_lov_set_dir_md(env, child, buf, handle);
342                 }
343         }
344         CDEBUG(D_INFO, "Set lov md %p size %d for fid "DFID" rc %d\n",
345                         lmmp, lmm_size, PFID(mdo2fid(child)), rc);
346         RETURN(rc);
347 }
348
349 /*
350  * XXX: this is for create lsm object id, which should identify the lsm object
351  * unique in the whole mds, as I see. But it seems, we still not need it
352  * now. Right? So just borrow the ll_fid_build_ino().
353  */
354 static obd_id mdd_lov_create_id(const struct lu_fid *fid)
355 {
356         return fid_flatten(fid);
357 }
358
359 int mdd_lov_objid_prepare(struct mdd_device *mdd, struct lov_mds_md *lmm)
360 {
361         /* copy mds_lov code is using wrong layer */
362         return mds_lov_prepare_objids(mdd->mdd_obd_dev, lmm);
363 }
364
365 void mdd_lov_objid_update(struct mdd_device *mdd, struct lov_mds_md *lmm)
366 {
367         /* copy mds_lov code is using wrong layer */
368         mds_lov_update_objids(mdd->mdd_obd_dev, lmm);
369 }
370
371 void mdd_lov_create_finish(const struct lu_env *env, struct mdd_device *mdd,
372                            struct lov_mds_md *lmm, int lmm_size,
373                            const struct md_op_spec *spec)
374 {
375         if (lmm && !spec->no_create)
376                 OBD_FREE(lmm, lmm_size);
377 }
378
379 int mdd_lov_create(const struct lu_env *env, struct mdd_device *mdd,
380                    struct mdd_object *parent, struct mdd_object *child,
381                    struct lov_mds_md **lmm, int *lmm_size,
382                    const struct md_op_spec *spec, struct lu_attr *la)
383 {
384         struct obd_device     *obd = mdd2obd_dev(mdd);
385         struct obd_export     *lov_exp = obd->u.mds.mds_osc_exp;
386         struct lu_site        *site = mdd2lu_dev(mdd)->ld_site;
387         struct obdo           *oa;
388         struct lov_stripe_md  *lsm = NULL;
389         const void            *eadata = spec->u.sp_ea.eadata;
390         __u32                  create_flags = spec->sp_cr_flags;
391         struct obd_trans_info *oti = &mdd_env_info(env)->mti_oti;
392         int                    rc = 0;
393         ENTRY;
394
395         if (!md_should_create(create_flags))
396                 RETURN(0);
397
398         oti_init(oti, NULL);
399
400         /* replay case, has objects already, only get lov from eadata */
401         if (spec->no_create != 0) {
402                 *lmm = (struct lov_mds_md *)spec->u.sp_ea.eadata;
403                 *lmm_size = spec->u.sp_ea.eadatalen;
404                 RETURN(0);
405         }
406
407         if (OBD_FAIL_CHECK(OBD_FAIL_MDS_ALLOC_OBDO))
408                 GOTO(out_ids, rc = -ENOMEM);
409
410         LASSERT(lov_exp != NULL);
411         oa = &mdd_env_info(env)->mti_oa;
412
413         oa->o_uid = 0; /* must have 0 uid / gid on OST */
414         oa->o_gid = 0;
415         oa->o_gr = mdt_to_obd_objgrp(lu_site2md(site)->ms_node_id);
416         oa->o_mode = S_IFREG | 0600;
417         oa->o_id = mdd_lov_create_id(mdd_object_fid(child));
418         oa->o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLFLAGS |
419                 OBD_MD_FLMODE | OBD_MD_FLUID | OBD_MD_FLGID | OBD_MD_FLGROUP;
420         oa->o_size = 0;
421
422         if (!(create_flags & MDS_OPEN_HAS_OBJS)) {
423                 if (create_flags & MDS_OPEN_HAS_EA) {
424                         LASSERT(eadata != NULL);
425                         rc = obd_iocontrol(OBD_IOC_LOV_SETSTRIPE, lov_exp,
426                                            0, &lsm, (void*)eadata);
427                         if (rc)
428                                 GOTO(out_oti, rc);
429                         lsm->lsm_object_id = oa->o_id;
430                         lsm->lsm_object_gr = oa->o_gr;
431                 } else if (parent != NULL) {
432                         /* get lov ea from parent and set to lov */
433                         struct lov_mds_md *_lmm;
434                         int _lmm_size;
435
436                         _lmm_size = mdd_lov_mdsize(env, mdd);
437                         _lmm = mdd_max_lmm_get(env, mdd);
438
439                         if (_lmm == NULL)
440                                 GOTO(out_oti, rc = -ENOMEM);
441
442                         rc = mdd_get_md_locked(env, parent, _lmm,
443                                                &_lmm_size,
444                                                XATTR_NAME_LOV);
445                         if (rc > 0)
446                                 rc = obd_iocontrol(OBD_IOC_LOV_SETSTRIPE,
447                                                    lov_exp, 0, &lsm, _lmm);
448                         if (rc)
449                                 GOTO(out_oti, rc);
450                 }
451
452                 rc = obd_create(lov_exp, oa, &lsm, oti);
453                 if (rc) {
454                         if (rc > 0) {
455                                 CERROR("Create error for "DFID": %d\n",
456                                        PFID(mdo2fid(child)), rc);
457                                 rc = -EIO;
458                         }
459                         GOTO(out_oti, rc);
460                 }
461                 LASSERT_MDS_GROUP(lsm->lsm_object_gr);
462         } else {
463                 LASSERT(eadata != NULL);
464                 rc = obd_iocontrol(OBD_IOC_LOV_SETEA, lov_exp, 0, &lsm,
465                                    (void*)eadata);
466                 if (rc)
467                         GOTO(out_oti, rc);
468                 lsm->lsm_object_id = oa->o_id;
469                 lsm->lsm_object_gr = oa->o_gr;
470         }
471
472         /*
473          * Sometimes, we may truncate some object(without lsm) then open it
474          * (with write flags), so creating lsm above.  The Nonzero(truncated)
475          * size should tell ost, since size attr is in charge by OST.
476          */
477         if (la->la_size && la->la_valid & LA_SIZE) {
478                 struct obd_info *oinfo = &mdd_env_info(env)->mti_oi;
479
480                 memset(oinfo, 0, sizeof(*oinfo));
481
482                 /* When setting attr to ost, FLBKSZ is not needed. */
483                 oa->o_valid &= ~OBD_MD_FLBLKSZ;
484                 obdo_from_la(oa, la, OBD_MD_FLTYPE | OBD_MD_FLATIME |
485                              OBD_MD_FLMTIME | OBD_MD_FLCTIME | OBD_MD_FLSIZE);
486
487                 /*
488                  * XXX: Pack lustre id to OST, in OST, it will be packed by
489                  * filter_fid, but can not see what is the usages. So just pack
490                  * o_seq o_ver here, maybe fix it after this cycle.
491                  */
492                 oa->o_fid = fid_seq(mdd_object_fid(child));
493                 oa->o_generation = fid_oid(mdd_object_fid(child));
494                 oa->o_valid |= OBD_MD_FLFID | OBD_MD_FLGENER;
495                 oinfo->oi_oa = oa;
496                 oinfo->oi_md = lsm;
497                 oinfo->oi_capa = NULL;
498                 oinfo->oi_policy.l_extent.start = la->la_size;
499                 oinfo->oi_policy.l_extent.end = OBD_OBJECT_EOF;
500
501                 rc = obd_punch_rqset(lov_exp, oinfo, oti);
502                 if (rc) {
503                         CERROR("Error setting attrs for "DFID": rc %d\n",
504                                PFID(mdo2fid(child)), rc);
505                         if (rc > 0) {
506                                 CERROR("obd_setattr for "DFID" rc %d\n",
507                                         PFID(mdo2fid(child)), rc);
508                                 rc = -EIO;
509                         }
510                         GOTO(out_oti, rc);
511                 }
512         }
513
514         /* blksize should be changed after create data object */
515         la->la_valid |= LA_BLKSIZE;
516         la->la_blksize = oa->o_blksize;
517         *lmm = NULL;
518         rc = obd_packmd(lov_exp, lmm, lsm);
519         if (rc < 0) {
520                 CERROR("Cannot pack lsm, err = %d\n", rc);
521                 GOTO(out_oti, rc);
522         }
523         if (mdd_lov_objid_prepare(mdd, *lmm) != 0) {
524                 CERROR("Not have memory for update objid\n");
525                 OBD_FREE(*lmm, rc);
526                 *lmm = NULL;
527                 GOTO(out_oti, rc = -ENOMEM);
528         }
529         *lmm_size = rc;
530         rc = 0;
531         EXIT;
532 out_oti:
533         oti_free_cookies(oti);
534 out_ids:
535         if (lsm)
536                 obd_free_memmd(lov_exp, &lsm);
537
538         return rc;
539 }
540
541 /*
542  * used when destroying orphans and from mds_reint_unlink() when MDS wants to
543  * destroy objects on OSS.
544  */
545 static
546 int mdd_lovobj_unlink(const struct lu_env *env, struct mdd_device *mdd,
547                       struct mdd_object *obj, struct lu_attr *la,
548                       struct lov_mds_md *lmm, int lmm_size,
549                       struct llog_cookie *logcookies,
550                       int log_unlink)
551 {
552         struct obd_device     *obd = mdd2obd_dev(mdd);
553         struct obd_export     *lov_exp = obd->u.mds.mds_osc_exp;
554         struct lov_stripe_md  *lsm = NULL;
555         struct obd_trans_info *oti = &mdd_env_info(env)->mti_oti;
556         struct obdo           *oa = &mdd_env_info(env)->mti_oa;
557         struct lu_site        *site = mdd2lu_dev(mdd)->ld_site;
558         int rc;
559         ENTRY;
560
561         if (lmm_size == 0)
562                 RETURN(0);
563
564         rc = obd_unpackmd(lov_exp, &lsm, lmm, lmm_size);
565         if (rc < 0) {
566                 CERROR("Error unpack md %p\n", lmm);
567                 RETURN(rc);
568         } else {
569                 LASSERT(rc >= sizeof(*lsm));
570                 rc = 0;
571         }
572
573         oa->o_id = lsm->lsm_object_id;
574         oa->o_gr = mdt_to_obd_objgrp(lu_site2md(site)->ms_node_id);
575         oa->o_mode = la->la_mode & S_IFMT;
576         oa->o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLGROUP;
577
578         oti_init(oti, NULL);
579         if (log_unlink && logcookies) {
580                 oa->o_valid |= OBD_MD_FLCOOKIE;
581                 oti->oti_logcookies = logcookies;
582         }
583
584         CDEBUG(D_INFO, "destroying OSS object %d/%d\n",
585                         (int)oa->o_id, (int)oa->o_gr);
586
587         rc = obd_destroy(lov_exp, oa, lsm, oti, NULL, NULL);
588
589         obd_free_memmd(lov_exp, &lsm);
590         RETURN(rc);
591 }
592
593 /*
594  * called with obj not locked. 
595  */
596
597 int mdd_lov_destroy(const struct lu_env *env, struct mdd_device *mdd,
598                     struct mdd_object *obj, struct lu_attr *la)
599 {
600         struct md_attr    *ma = &mdd_env_info(env)->mti_ma;
601         int                rc;
602         ENTRY;
603
604         if (unlikely(la->la_nlink != 0)) {
605                 CWARN("Attempt to destroy OSS object when nlink == %d\n",
606                       la->la_nlink);
607                 RETURN(0);
608         }
609
610         ma->ma_lmm_size = mdd_lov_mdsize(env, mdd);
611         ma->ma_lmm = mdd_max_lmm_get(env, mdd);
612         ma->ma_cookie_size = mdd_lov_cookiesize(env, mdd);
613         ma->ma_cookie = mdd_max_cookie_get(env, mdd);
614         if (ma->ma_lmm == NULL || ma->ma_cookie == NULL)
615                 RETURN(rc = -ENOMEM);
616
617         /* get lov ea */
618
619         rc = mdd_get_md_locked(env, obj, ma->ma_lmm, &ma->ma_lmm_size,
620                                XATTR_NAME_LOV);
621
622         if (rc <= 0) {
623                 CWARN("Get lov ea failed for "DFID" rc = %d\n",
624                          PFID(mdo2fid(obj)), rc);
625                 if (rc == 0)
626                         rc = -ENOENT;
627                 RETURN(rc);
628         }
629
630         ma->ma_valid = MA_LOV;
631         
632         rc = mdd_unlink_log(env, mdd, obj, ma);
633         if (rc) {
634                 CWARN("mds unlink log for "DFID" failed: %d\n",
635                        PFID(mdo2fid(obj)), rc);
636                 RETURN(rc);
637         }
638
639         if (ma->ma_valid & MA_COOKIE)
640                 rc = mdd_lovobj_unlink(env, mdd, obj, la,
641                                        ma->ma_lmm, ma->ma_lmm_size,
642                                        ma->ma_cookie, 1);
643         RETURN(rc);
644 }
645
646 int mdd_log_op_unlink(struct obd_device *obd,
647                       struct lov_mds_md *lmm, int lmm_size,
648                       struct llog_cookie *logcookies, int cookies_size)
649 {
650         struct mds_obd *mds = &obd->u.mds;
651         struct lov_stripe_md *lsm = NULL;
652         struct llog_unlink_rec *lur;
653         struct llog_ctxt *ctxt;
654         int rc;
655         ENTRY;
656
657         if (IS_ERR(mds->mds_osc_obd))
658                 RETURN(PTR_ERR(mds->mds_osc_obd));
659
660         rc = obd_unpackmd(mds->mds_osc_exp, &lsm, lmm, lmm_size);
661         if (rc < 0)
662                 RETURN(rc);
663         rc = obd_checkmd(mds->mds_osc_exp, obd->obd_self_export, lsm);
664         if (rc)
665                 GOTO(out, rc);
666         /* first prepare unlink log record */
667         OBD_ALLOC(lur, sizeof(*lur));
668         if (!lur)
669                 GOTO(out, rc = -ENOMEM);
670         lur->lur_hdr.lrh_len = lur->lur_tail.lrt_len = sizeof(*lur);
671         lur->lur_hdr.lrh_type = MDS_UNLINK_REC;
672
673         ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
674         rc = llog_add(ctxt, &lur->lur_hdr, lsm, logcookies,
675                       cookies_size / sizeof(struct llog_cookie));
676         llog_ctxt_put(ctxt);
677
678         OBD_FREE(lur, sizeof(*lur));
679         GOTO(out, rc);
680 out:
681         obd_free_memmd(mds->mds_osc_exp, &lsm);
682         return rc;
683 }
684
685 int mdd_unlink_log(const struct lu_env *env, struct mdd_device *mdd,
686                    struct mdd_object *mdd_cobj, struct md_attr *ma)
687 {
688         struct obd_device *obd = mdd2obd_dev(mdd);
689
690         LASSERT(ma->ma_valid & MA_LOV);
691
692         if ((ma->ma_cookie_size > 0) &&
693             (mdd_log_op_unlink(obd, ma->ma_lmm, ma->ma_lmm_size,
694                                ma->ma_cookie, ma->ma_cookie_size) > 0)) {
695                 ma->ma_valid |= MA_COOKIE;
696         }
697         return 0;
698 }
699
700 int mdd_log_op_setattr(struct obd_device *obd, __u32 uid, __u32 gid,
701                       struct lov_mds_md *lmm, int lmm_size,
702                       struct llog_cookie *logcookies, int cookies_size)
703 {
704         struct mds_obd *mds = &obd->u.mds;
705         struct lov_stripe_md *lsm = NULL;
706         struct llog_setattr64_rec *lsr;
707         struct llog_ctxt *ctxt;
708         int rc;
709         ENTRY;
710
711         if (IS_ERR(mds->mds_osc_obd))
712                 RETURN(PTR_ERR(mds->mds_osc_obd));
713
714         rc = obd_unpackmd(mds->mds_osc_exp, &lsm, lmm, lmm_size);
715         if (rc < 0)
716                 RETURN(rc);
717
718         rc = obd_checkmd(mds->mds_osc_exp, obd->obd_self_export, lsm);
719         if (rc)
720                 GOTO(out, rc);
721
722         OBD_ALLOC(lsr, sizeof(*lsr));
723         if (!lsr)
724                 GOTO(out, rc = -ENOMEM);
725
726         /* prepare setattr log record */
727         lsr->lsr_hdr.lrh_len = lsr->lsr_tail.lrt_len = sizeof(*lsr);
728         lsr->lsr_hdr.lrh_type = MDS_SETATTR64_REC;
729         lsr->lsr_uid = uid;
730         lsr->lsr_gid = gid;
731
732         /* write setattr log */
733         ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
734         rc = llog_add(ctxt, &lsr->lsr_hdr, lsm, logcookies,
735                       cookies_size / sizeof(struct llog_cookie));
736
737         llog_ctxt_put(ctxt);
738
739         OBD_FREE(lsr, sizeof(*lsr));
740  out:
741         obd_free_memmd(mds->mds_osc_exp, &lsm);
742         RETURN(rc);
743 }
744
745 int mdd_setattr_log(const struct lu_env *env, struct mdd_device *mdd,
746                     const struct md_attr *ma,
747                     struct lov_mds_md *lmm, int lmm_size,
748                     struct llog_cookie *logcookies, int cookies_size)
749 {
750         struct obd_device *obd = mdd2obd_dev(mdd);
751
752         /* journal chown/chgrp in llog, just like unlink */
753         if (lmm_size > 0) {
754                 CDEBUG(D_INFO, "setattr llog for uid/gid=%lu/%lu\n",
755                         (unsigned long)ma->ma_attr.la_uid,
756                         (unsigned long)ma->ma_attr.la_gid);
757                 return mdd_log_op_setattr(obd, ma->ma_attr.la_uid,
758                                           ma->ma_attr.la_gid, lmm,
759                                           lmm_size, logcookies,
760                                           cookies_size);
761         } else
762                 return 0;
763 }
764
765 static int mdd_osc_setattr_async(struct obd_device *obd, __u32 uid, __u32 gid,
766                           struct lov_mds_md *lmm, int lmm_size,
767                           struct llog_cookie *logcookies, __u64 id, __u32 gen,
768                           struct obd_capa *oc)
769 {
770         struct mds_obd *mds = &obd->u.mds;
771         struct obd_trans_info oti = { 0 };
772         struct obd_info oinfo = { { { 0 } } };
773         int rc;
774         ENTRY;
775
776         if (OBD_FAIL_CHECK(OBD_FAIL_MDS_OST_SETATTR))
777                 RETURN(0);
778
779         /* first get memory EA */
780         OBDO_ALLOC(oinfo.oi_oa);
781         if (!oinfo.oi_oa)
782                 RETURN(-ENOMEM);
783
784         LASSERT(lmm);
785
786         rc = obd_unpackmd(mds->mds_osc_exp, &oinfo.oi_md, lmm, lmm_size);
787         if (rc < 0) {
788                 CERROR("Error unpack md %p for inode "LPU64"\n", lmm, id);
789                 GOTO(out, rc);
790         }
791
792         rc = obd_checkmd(mds->mds_osc_exp, obd->obd_self_export, oinfo.oi_md);
793         if (rc) {
794                 CERROR("Error revalidate lsm %p \n", oinfo.oi_md);
795                 GOTO(out, rc);
796         }
797
798         /* then fill oa */
799         oinfo.oi_oa->o_uid = uid;
800         oinfo.oi_oa->o_gid = gid;
801         oinfo.oi_oa->o_id = oinfo.oi_md->lsm_object_id;
802         oinfo.oi_oa->o_gr = oinfo.oi_md->lsm_object_gr;
803         oinfo.oi_oa->o_valid |= OBD_MD_FLID | OBD_MD_FLGROUP |
804                                 OBD_MD_FLUID | OBD_MD_FLGID;
805         if (logcookies) {
806                 oinfo.oi_oa->o_valid |= OBD_MD_FLCOOKIE;
807                 oti.oti_logcookies = logcookies;
808         }
809
810         oinfo.oi_oa->o_fid = id;
811         oinfo.oi_oa->o_generation = gen;
812         oinfo.oi_oa->o_valid |= OBD_MD_FLFID | OBD_MD_FLGENER;
813         oinfo.oi_capa = oc;
814
815         /* do async setattr from mds to ost not waiting for responses. */
816         rc = obd_setattr_async(mds->mds_osc_exp, &oinfo, &oti, NULL);
817         if (rc)
818                 CDEBUG(D_INODE, "mds to ost setattr objid 0x"LPX64
819                        " on ost error %d\n", oinfo.oi_md->lsm_object_id, rc);
820 out:
821         if (oinfo.oi_md)
822                 obd_free_memmd(mds->mds_osc_exp, &oinfo.oi_md);
823         OBDO_FREE(oinfo.oi_oa);
824         RETURN(rc);
825 }
826
827 int mdd_lov_setattr_async(const struct lu_env *env, struct mdd_object *obj,
828                           struct lov_mds_md *lmm, int lmm_size,
829                           struct llog_cookie *logcookies)
830 {
831         struct mdd_device   *mdd = mdo2mdd(&obj->mod_obj);
832         struct obd_device   *obd = mdd2obd_dev(mdd);
833         struct lu_attr      *tmp_la = &mdd_env_info(env)->mti_la;
834         const struct lu_fid *fid = mdd_object_fid(obj);
835         int rc = 0;
836         ENTRY;
837
838         mdd_read_lock(env, obj, MOR_TGT_CHILD);
839         rc = mdo_attr_get(env, obj, tmp_la, mdd_object_capa(env, obj));
840         mdd_read_unlock(env, obj);
841         if (rc)
842                 RETURN(rc);
843
844         rc = mdd_osc_setattr_async(obd, tmp_la->la_uid, tmp_la->la_gid, lmm,
845                                    lmm_size, logcookies, fid_seq(fid),
846                                    fid_oid(fid), NULL);
847         RETURN(rc);
848 }